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图 灵 社 区 的 电子 书 没有 采用 专 有 客 
户 端 ， 您 可 以 在 任意 设备 上 ， 用 自 
己 喜 欢 的 浏览 器 和 PDF 阅读 器 进行 
阅读 。 

但 您 购买 的 电子 书 仅 供 您 个 人 使 
用 ,未 经 授权 ， 不 得 进行 传播 。 
我 们 愿意 相信 读者 具有 这 样 的 民 知 
和 觉悟 ， 与 我 们 共同 保护 知识 产 
权 。 
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热衷 于 为 计算 机 编写 程序 。 
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年 轻 的 Linux 天 才 程 序 员 、 开 源 软 
件 及 GNU/Linux 活 跃 分 子 。 他 作为 
SLYNUX(2005) 的 开发 者 而 广 为 
人 知 ， 这 是 一 款 面 向 Linux 新 手 的 操 
作 友 好 的 GNU/Linux 发 布 版 。 另 外 ， 
他 还 为 Linux For You 月 刊 撰写 文章 ， 
并 且 还 在 Fedora、Pardus Linux、 
PiTiVi、Ubuntu 以 及 Google 编 程 夏令 
营 等 项 目 中 ， 他 都 作出 了 显著 的 贡献 。 
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Unix /Linux shell、Perl、 正 则 表达 式 
爱好 者 。 在 2001 年 接触 Linux 后 很 快 
喜欢 上 该 系统 。 对 Unix / Linux 系 统 
管理 、Linux 内 核 、Web 技 术 研 究 鼎 
多 。 工 作 之 余 ， 还 喜欢 探讨 心理 学 ， 
热 衰 出 没 于 豆瓣 和 知 乎 。 除 此 书 外 ， 
他 还 译 有 《TCP Sockets 编 程 》 和 《 理 
解 Unix 进 程 》。 








WL 国 图 灵 程 序 设 计 丛 书 


Linux Shell 脚本 攻略 
(第 2 版 ) 


[ 印 ] Shantanu Tushar 著 


Sarath Lakshman 门 佳 译 


人 民 邮 电 出 版 社 
北 京 


图 书 在 版 编目 (C I P ) 数据 


Linux Shell 脚 本 攻略 : 第 2 版 / ( 印 ) 图 沙 尔 
(Tushar, S. ) ，( 印 ) 拉克 什 鼻 (Lakshman, S.) 车 ; 门 
佳 译 . 一 北京 : 人 民 邮 电 出 版 社 ，2014. 1 

(图 灵 程 序 设计 从 书 ) 

书 名 原文 : Linux Shell scripting cookbook， 
Second Edition 

ISBN 978-7-115-33921-8 


I ，O@L… 工 ，@ 图 … @ 拉 … 图 门 … IT， QDLinux 操 
作 系 统一 程序 设计 IV. QTP316. 89 


中 国 版 本 图 书馆 CIP 数 据 核 字 (2013) 第 285766 号 












































内 容 提要 


本 书 结合 丰富 的 实际 案例 介绍 了 如 何 利用 shell 命令 快速 开发 常规 任务 ， 如 何 凭借 短 算 
Web 挖掘 数据 的 shell 脚本 ， 如 何 通过 shell 脚本 设置 以 太 网 和 无 线 LAN， 以 及 如 何 利用 少 
成 诸如 文本 处 理 、 文 件 管理 、 备 份 等 复杂 的 数据 管理 工作 等 。 

本 书面 向 初 、 中 、 高 级 Linux 系统 管理 员 和 程序 员 ， 是 编写 shell 脚本 的 绝 佳 参考 资料 。 
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一 一 Shantanu Tushar 
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GNU/Linux 是 世界 上 最 强大 、 最 灵活 的 操作 系统 之 一 。 在 现代 计算 领域 中 ， 它 可 谓 无 处 不 在 ,从 
服务 器 、 便 携 式 计算 机 、 移 动 电话 、 平 板 电 脑 到 超级 计算 机 ， 概 莫 能 外 。 尽 管 配备 了 优美 、 时 晓 
的 图形 用 户 界 面 ， 但 shell 依 然 是 同 Linux 进 行 交 互 的 最 灵活 的 方式 。 


除了 执行 单独 的 命令 , shell 还 可 以 执行 命令 脚本 , 所 以 非常 易于 实现 各 种 任务 的 自动 化 操作 ， 
如 生成 报表 、 发 送 电子 邮件 、 进 行 系统 维护 等 。 本 书包 含 各 式 各 样 的 攻略 ， 演 示 了 命令 及 shell 
脚本 的 实战 用 法 。 你 可 以 将 其 作为 参考 , 或 是 自己 编写 脚本 时 的 灵感 源泉 。 书 中 涉及 的 任务 包括 
文本 处 理 、 网 络 运 维 、 系 统管 理 ， 不 一 而 足 。 


和 学 习 其 他 手艺 一 样 ， 熟 能 生 巧 。 待 你 成 为 shell 脚 本 行家 之 日 ， 方 能 完全 发 挥 并 驾驭 shell 的 
真 力 。 本 书 会 告诉 你 如 何 达 成 这 一 目标 ! 


























II 























本 书 内 容 


第 1 章 : 小 试 牛 刀 。 作 为 用 于 理解 Bash 的 基本 概念 及 特性 的 入 门 章节 ， 这 一 章 讨论 了 终端 打 
印 、 数 学 运算 以 及 其 他 一 些 简单 的 Bash 功 能 。 


第 2 章 : 命令 之 乐 。 这 一 章 展示 了 GNU/Linux 中 的 常用 命令 ， 历 数 了 用 户 可 能 会 遇 到 或 是 可 
以 善 加 利用 的 各 种 实践 用 例 。 除 了 基础 命令 之 外 ， 在 这 一 版 中 还 讨论 了 加 密 散 列 命 令 
(cryptographic hashing command ) 和 尽 可 能 并 行 执行 命令 的 方法 。 


第 3 章 : 以 文件 之 名 。 这 一 章 包 含 了 与 文件 及 文件 系统 相关 的 多 条 攻略 ， 讲 解 了 如 何 生成 大 
体积 文件 、 将 文件 系统 写 人 文件 、 挂 载 文件 、 创 建 ISO 镜像 。 我 们 还 探讨 了 查找 并 删除 重复 文件 、 
统计 文件 行 数 、 收 集 文件 详细 信息 等 操作 。 

第 4 章 : 让 文本 飞 。 这 一 章 结 合 任务 实例 讲解 了 GNU/Linux 下 大 部 分 命令 行文 本 处 理工 具 。 
此 外 还 包含 了 一 些 补充 内 容 , 详细 介绍 了 正则 表达 式 以 及 sed/awk 命 令 。 本 章 对 多 数 常 见 的 文本 
处 理 任务 逐一 给 出 了 解决 方案 。 这 些 都 是 实战 中 不 可 不 知 的 技巧 。 

第 5 章 : 一 团 乱 麻 ? 没 这 回 事 。 这 一 章 包 含 了 多 个 同 互 联网 服务 相关 的 shell 脚 本 ， 旨 在 帮助 
读者 理解 如 何 使 用 shell 脚 本 与 Web 进 行 交 互 ， 以 实现 诸如 Web 页 面 数据 采集 、 解 析 等 任务 的 自动 












































化 操作 。 讲 解 了 以 POST 和 GET 方 式 发 送 网 页 ， 提 交 客 户 数 据 到 服务 器 的 方法 。 在 这 一 版 中 ， 就 
Twitter 这 类 服务 ， 采 用 了 一 种 全 新 的 授权 机 制 一 一 OAuth。 


第 6 章 : B 计 划 。 这 一 章 演示 了 用 于 数据 备份 、 归 档 、 压 缩 等 若干 命令 。 除 了 更 快 的 压缩 技 
术 ， 这 一 版 还 讨论 了 如 何 创建 全 盘 镜 像 。 


第 7 章 : 无 网 不 利 。 这 一 章 涵盖 了 Linux 环 境 下 的 联网 实践 以 及 若干 有 助 于 编写 网 络 shell 脚 本 
的 命令 。 首 先 介绍 了 一 些 网 络 基础 知识 ， 随 后 讲解 了 ssh 的 用 法 ， 这 可 算得 上 是 现代 GNU/Linux 
系统 中 最 强大 的 命令 之 一 。 除 此 之 外 ， 我 们 还 讨论 了 高 级 端口 转发 、 设 置 原始 通信 信道 (raw 
communication channel )、 防 火 墙 配置 等 内 容 。 


第 8 章 : 当 个 好 管家 。 这 一 章 介 绍 了 Linux 系 统 活 动 监视 相关 的 攻略 以 及 日 志 记录 和 报表 生成 ， 
讲解 了 计算 磁盘 使 用 情况 、 监 视 用 户 访 问 、CPU 占 用 等 任务 。 在 这 一 版 中 , 我 们 还 会 讲述 优化 电 
源 使 用 、 检 查 磁盘 和 文件 系统 错误 的 方法 。 


第 9 章 : 管理 重任 。 这 一 章 涉及 一 系列 系统 管理 方面 的 实战 攻略 ， 讲 解 了 各 种 用 于 收集 系统 
详细 信息 的 命令 以 及 使 用 脚本 进行 用 户 管理 的 方法 , 还 讨论 了 大 图 片 缩放 、 通 过 shell 访 问 MySQL 
数据 库 。 在 这 一 版 中 , 我 们 还 会 学 习 在 不 借助 窗口 管理 器 的 情况 下 ,如 何 使 用 GNU Screen 来 管理 
多 个 终端 。 





















































阅读 本 书 要 求 


只 要 具备 任何 一 种 GNU/Linux 平 台 的 一 般 性 使 用 经 验 ， 都 能 很 轻松 地 阅读 本 书 。 我 们 已 竭尽 
所 能 地 确保 书 中 的 所 有 例子 清晰 明了 、 简 单 易 懂 。 在 Linux 平 台 下 学 习 的 好 奇 心 是 你 阅读 本 书 所 
需 的 唯一 条 件 。 我 们 为 你 提供 了 循序 渐进 的 辅导 ， 助 你 解决 书 中 有 关 脚 本 编写 的 难题 。 为 了 运行 
并 测试 书 中 的 例子 ， 我 们 推荐 安装 UbuntuDebian Linux。 当 然 ， 其 他 的 Linux 发 行 版 也 足以 胜任 
绝 大 多 数 任务 。 你 会 发 现 就 编写 shell 脚 本 来 说 ， 本 书 绝对 是 一 份 通俗 易 懂 的 参考 资料 ， 同 时 也 是 
一 位 助 你 编写 高 效 脚本 的 良师益友 。 



























































本 书 读 者 对 象 


如 果 你 是 一 位 初中 级 用 户 , 希望 通过 掌握 快速 编写 脚本 的 技巧 来 完成 各 类 事务 处 理 , 而 又 不 
愿 去 逐 页 翻阅 手册 ， 那 么 本 书 就 是 写 给 你 的 。 你 不 用 了 解 任何 shell 脚 本 或 Linux 的 工作 原理 ， 只 
需要 参照 书 中 类 似 的 例子 和 描述 就 可 以 动手 了 。 对 于 中 高 级 用 户 以 及 系统 管理 员 或 程序 员 而 言 ， 
本 书 则 是 在 编码 过 程 中 寻求 问题 解决 之 道 的 一 份 绝 佳 参 考 资料 。 









































本 书 约定 
本 书 用 多 种 不 同 格式 的 文本 来 区 分 不 同 种 类 的 信息 。 下 面 是 各 类 格式 的 例子 及 其 所 代表 的 含义 。 


正文 中 的 代码 片段 像 这 样 显示 :“ 我 们 创建 了 名 为 repeat 的 函数 , 它 包 含 了 一 个 无 限 while 
循环 ， 该 循环 尝试 运行 被 作为 函数 参数 ( 通过 $e 访问 ) 传人 的 命令 。 








代码 块 以 如 下 形式 显示 : 

if [ $var -eq 0 ]; then echo "True"; fi 
还 可 以 写成 : 

if test S$var -eq 0 ; then echo "True"; fi 


如 果 我 们 希望 你 注意 代码 块 的 某 部 分 ， 那么 会 使 用 粗 体 显示 相关 的 代码 行 或 条 


while read line; 
do something 
done < filename 


命令 行 输入 或 输出 写成 如 下 形式 : 


# mkdir /mnt/loopback 
# mount -oO loop loopbackfile.img /mnt/loopback 


新 术语 和 重要 的 词句 显示 为 粗 体 。 


| 受 警告 或 重要 的 提示 出 现在 这 里 。 ] 


建议 和 窍门 则 会 以 这 种 方式 出 现 。 


读 卖 者 反馈 Li 
十 分 欢迎 读者 提供 反馈 意见 。 我 们 想 知 道 你 对 本 书 的 看 法 : Sn 不 喜欢 哪些 部 分 。 
这 些 反馈 对 于 协助 我 们 编写 出 真正 对 读者 有 所 神 益 的 书 至 关 重要 。" 


你 只 需要 向 feedback@packtpub.com 发 送 电子 邮件 , 并 在 邮件 标题 中 注 明 书 名 即 可 。 如 果 你 在 某 











反馈 意见 、 勘 误 以 及 下 载 本 书 示例 代码 。 
编者 注 








Qa 读者 也 可 以 登录 图 灵 社 区 , 在 本 书 的 页 面 ( ituring.com.cn/book/1170 ) 下 提交 


























方面 有 所 专长 并 且 愿 意 参 与 图 书 编写 或 出 版 ， 请 参阅 我 们 的 作者 指南 www.packtpub. com/authors。 


客户 支持 


现在 你 已 经 拥有 了 这 本 由 Packt 出 版 的 图 书 ， 为 了 让 此 书 尽 可 能 地 物 有 所 值 ， 我 们 还 为 你 提 
供 了 其 他 诸多 方面 的 服务 。 


下 载 示例 代码 


你 可 以 在 http://www.packtput.com 下 载 本 书 及 你 所 购买 的 所 有 Packt 图 书 的 示例 代码 。 如 果 你 
是 在 其 他 地 方 购买 的 本 书 的 英文 版 ， 可 以 访问 http://www.packtput.com/support 并 注册 ， 示 例 代码 
将 用 电子 邮件 发 送 给 你 。 
































勘误 


尽管 我 们 已 经 竭尽 全 力 确保 本 书 内 容 准 确 , 但 错误 终 难 避免 如果 你 发 现 了 书 中 的 任何 错误 ， 
无 论 是 出 现在 正文 还 是 代码 中 的 , 我 们 都 非常 乐于 见 到 你 将 错误 提交 给 我 们 。 这 样 不 仅 能 够 减少 
其 他 读者 的 困惑 ， 还 能 帮助 我 们 改进 本 书后 续 版 本 的 质量 。 如 果 需 要 提交 勘误 ， 请 访问 
http:/www.packtpub.com/submit-errata ， 选 择 相应 的 书 名 , 单 击 勘误 提交 表单 链接 ， 就 可 以 开始 输 
入 详细 的 勘误 信息 了 。 一 旦 勘误 得 到 确认 , 我 们 将 接受 你 的 提交 ， 同 时 勘误 内 容 也 将 被 上 传 到 我 
们 的 网 站 ,或 者 被 添加 到 对 应 书目 勘误 区 的 现 有 勘误 表 中 。 所 有 图 书 当前 的 勘误 都 可 以 通过 
http://www.packtpub.com/support 来 查看 。 























举报 盗版 


各 种 媒体 在 网 上 一 直 饱 受 版 权 侵害 的 困扰 。Packt 坚 持 严 格 保护 版 权 和 授权 。 如 果 你 在 网 上 发 
现 我 社 图 书 的 任何 形式 的 盗版 ， 请 立即 为 我 们 提供 地 址 或 网 站 名 称 ， 以 便 我 们 采取 进一步 的 措施 。 


请 将 疑似 侵权 的 网 站 链接 发 送 至 copyright@packtpub.com。 
非常 感谢 你 对 保护 作者 知识 产权 所 做 的 工作 ， 我 们 将 竭诚 为 读者 提供 有 价值 的 内 容 。 

















疑难 解答 
如 果 你 对 本 书 的 某 方面 抱 有 疑问 ， 请 通过 questions@packtpub.com 联 系 我 们 ， 我 们 会 尽力 为 
你 解决 。 
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本 章 内 容 
口 终端 打印 口 获取 、 设 置 日 期 及 延 时 
口 玩 转变 量 与 环境 变量 口 调试 脚本 
口 使 用 函数 填 加 环境 变量 口 函数 和 参数 
口 通过 shell 进 行 数 学 运算 口 将 命令 序列 的 输出 读 入 变量 
口 玩 转 文件 描述 符 与 重 定向 口 以 不 按 回 车 键 的 方式 获取 字符 "n" 
口 数组 和 关联 数组 口 运行 命令 直至 执行 成 功 
口 使 用 别名 口 字段 分 隔 符 和 迭代 需 
口 获取 终端 信息 口 比较 与 测试 
1.1 简介 





诸多 类 Unix 操 作 系 统 的 设计 令 人 惊叹 。 即 便 是 在 数 十 年 后 的 今天 ，Unix 式 的 操作 系统 架构 仍 
是 有 史 以 来 的 最 佳 设计 之 一 。 这 种 架构 最 重要 的 一 个 特性 就 是 命令 行 界面 或 shell。shell 环 境 使 得 
用 户 能 与 操作 系统 的 核心 功能 进行 交互 。 术 语 脚本 更 多 涉及 的 便 是 这 种 环境 。 编写 脚本 通常 使 用 
某 种 基于 解释 器 的 编程 语言 。 而 shell 脚 本 不 过 就 是 一 些 文件 , 我 们 能 将 一 系列 需要 执行 的 命令 写 
和 其中， 然后 通过 shell 来 执行 。 

本 书 使 用 的 是 Bash ( Bourne Again Shell )， 它 是 目前 大 多 数 GNU/Linux 系 统 默认 的 shell 环 境 。 
鉴于 GNU/Linux 作 为 基于 Unix 式 架构 最 杰出 操作 系统 的 地 位 , 书 中 大 部 分 案例 和 讨论 都 假定 是 在 
Linux 系 统 环境 下 进行 的 。 


本 章 的 主要 目的 是 让 读者 了 解 shell 环 境 并 熟悉 shell 的 基本 特性 。 命 令 都 是 在 shell 终 端 中 输入 
并 执行 。 打 开 终 端 后 ， 就 会 出 现 一 个 提示 符 。 其 形式 通常 如 下 : 














username@hostnames 


或 者 
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root@hostname # 
要 么 就 简单 地 以 $ 或 # 表 示 。 
s 表 示 普 通用 户 ，# 表 示 管 理 员 用 户 root。root 是 Linux 系 统 中 权限 最 高 的 用 户 。 








以 root 用 户 ( 管理 员 ) 的 身份 直接 使 用 shell 来 执行 任务 可 不 是 个 好 主意 。 因 
， ”为 如 果 shell 具 备 较 高 的 权限 ,命令 中 出 现 的 输入 错误 有 可 能 造成 更 严重 的 破坏 。 
所 以 推荐 使 用 普通 用 户 登录 系统 (使 用 $ 来 表明 这 种 身份 , root 登 录 时 要 使 用 #)， 
然后 借助 sudo 这 类 工具 来 运行 特权 命令 。 使 用 sudo <command> <arguments> 

这 种 形式 执行 命令 的 效果 和 root 一 样 。 


shell 脚 本 通常 是 一 个 以 shebang 起 始 的 文本 文件 ， 如 下 所 示 : 
#!/bin/bash 
shebang 是 一 个 文本 行 , 其 中 #! 位 于 解释 器 路 径 之 前 。/bin/bash 是 Bash 的 解释 器 命令 路 径 。 
有 两 种 运行 脚本 的 方式 。 一 种 是 将 脚本 作为 bash 的 命令 行 参数 ， 另 一 种 是 授予 脚本 执行 权 
限 ， 将 其 变 为 可 执行 文件 。 
将 脚本 作为 命令 行 参数 时 的 运行 方式 如 下 (# 号 后 面 的 文本 是 注释 , 不 必 输 入 到 命令 行 中 ) : 
$ bash script.sh # 假 设 脚本 位 于 当前 目录 下 
或 者 
$ bash /home/path/script.sh # 使 用 script .sh 的 完整 路 径 
如 果 将 脚本 作为 bash 的 命令 行 参 数 来 运行 ， 那么 就 用 不 着 脚本 中 的 shebang 了 。 


要 是 有 需要 的 话 ， 可 以 利用 shebang 来 实现 脚本 的 独立 运行 。 对 此 必须 设置 脚本 的 可 执行 权 
限 ， 这 样 它 就 可 以 使 用 位 于 # ! 之 后 的 解释 器 路 径 来 运行 了 。 就 像 这 样 : 

































































$ chmod a+x Script.sh 
该 命令 赋予 所 有 用 户 script .sh 文件 的 可 执行 权限 。 这 个 脚本 能 以 下 列 方式 执行 : 
$ ./script.sh #./ 表 示 当 前 目录 


或 者 


























GD shebang 这 个 词 其 实 是 两 个 字符 名 称 的 组 合 。 在 Unix 的 行 话 里 ， 用 sharp 或 hash ( 有 时 候 是 mesh ) 来 称呼 字符 “#”， 
用 bang 来 称呼 惊叹 号 “!”， 因 而 shebang 合 起 来 就 代表 了 这 两 个 字符 。 详 情 请 参考 : http://en.wikipedia.org/wiki/ 
Shebang (Unixz)。( 注 : 书 中 脚注 均 为 译 者 注 。) 
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$ /home/path/script.sh # 使 用 脚本 的 完整 路 径 ta 


内 核 会 读 取 脚本 的 首 行 并 注意 到 shebang 为 #!/bin/bash。 它 识别 出 /bin/bash 并 在 内 部 像 这 
样 执 行 该 脚本 : 








$ /bin/bash script.sh 


当 启 动 shell 时 ， 它 一 开始 会 执行 一 组 命令 来 定义 诸如 提示 文本 、 颜 色 等 各 类 设置 。 这 组 命令 
来 自 位 于 用 户主 目录 中 的 脚本 文件 ~/.bashrc ( 对 于 登录 shell 则 是 ~/.bash_profile )。 Bash 还 维护 了 一 
个 历史 记录 文件 ~/.bash_history， 用 于 保存 用 户 运 行 过 的 命令 。 


~ 表示 主 目录 ， 它 通常 是 /home/user， 其 中 user 是 用 户 名 ， 如 果 是 root 用 


户 ， 则 为 /root。 
> 登录 shell 是 登录 主机 后 获得 的 那个 shell。 如 果 登 录 图 形 界面 环境 ( 比如 
GNOME、KDE 等 ) 后 打开 了 一 个 shell， 就 不 是 登录 shell。 





在 Bash 中 ， 每 个 命令 或 是 命令 序列 是 通过 使 用 分 号 或 换行 符 来 分 隔 的 。 比 如 : 


$ cmdl ; cmd2 





字符 # 指 明 注释 的 开始 。 


注释 部 分 以 # 为 起 始 ， 一 直 延 续 到 行 尾 。 注 释 行 通常 用 于 为 代码 提供 注释 信息 ， 或 者 停止 执 
行 某 行 代码 。” 


现在 让 我 们 继续 讨论 基本 特性 。 











1.2 终端 打印 


终端 是 交互 式 工具 ， 用 户 可 以 通过 它 与 shell 环 境 进行 交互 。 在 终端 中 打印 文本 是 绝 大 多 数 
shell 脚 本 和 工具 日 常 需 要 执行 的 基本 任务 。 在 这 则 攻略 中 我 们 会 看 到 ， 可 以 使 用 各 种 方法 , 采用 
各 种 格式 进行 打印 。 








Q@ shell 不 执行 脚本 中 的 任何 注释 部 分 。 
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1.2.1 ”实战 演练 
echo 是 用 于 终端 打印 的 基本 命令 。 


在 默认 情况 下 ，echo 在 每 次 调用 后 会 添加 一 个 换行 符 。 








$ echo "Welcome to Bash" 
Welcome to Bash 


只 需要 使 用 带 双 引号 的 文本 ,结合 echo 命 令 就 可 以 将 该 文本 在 终端 中 打印 出 来 。 类 似 地 ， 
不 带 双 引号 的 文本 也 可 以 得 到 同样 的 输出 结 


/ 
站 





$ echo Welcome to Bash 
Welcome to Bash 


使 用 单 引 号 也 可 以 完成 同样 的 任务 : 








$ echo 'text in quotes' 


这 些 方法 看 起 来 相似 ,但 各 有 一 些 特殊 用 途 和 副作用 。 思 考 下 面 这 行 命令 : 

















$ echo "cannot include exclamation - ! within double quotes" 
这 条 命令 将 会 返回 : 
bash: !: event not found error 
因此 ， 如 果 需 要 打印 '!， 那 就 不 要 将 其 放 入 双 引 号 中 ,或 者 你 可 以 在 其 之 前 加 上 一 个 特殊 的 
转 义 字符 (\ ) 将 ! 转 义 ， 就 像 这 样 : 
$ echo Hello world ! 
或 者 
$ echo 'Hello world !' 
或 者 
$ echo "Hello world \!" # 将 转 义 字符 放 在 前 面 
每 种 方法 的 副作用 如 下 所 述 。 
口 使 用 不 带 引 号 的 echo 时 ， 没 法 在 所 要 显示 的 文本 中 使 用 分 号 ( ; )， 因 为 分 号 在 Bash shell 
中 被 用 作 命 令 定 界 符 。 
口 以 scho hello;hel1o 为 例 ，echo hello 被 视 为 一 个 命令 ， 第 二 个 hel1o 则 被 视 为 男 一 


个 命令 。 


口 变量 替换 在 单 引 号 中 无 效 ， 在 下 一 则 攻略 中 会 详细 讨论 。 
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男 一 个 可 用 于 终端 打印 的 命令 是 printf。printf 使 用 的 参数 和 C 语 言 中 的 printf 函 数 一 
样 。 例 如 : 


$ printf "Hello world" 


printf 使 用 引用 文本 或 由 空格 分 隔 的 参数 。 我 们 可 以 在 printf 中 使 用 格式 化 字符 串 , 还 可 以 指 
定 字符 串 的 宽度 、 左 右 对 齐 方式 等 。 在 默认 情况 下 ，printf 并 不 像 echo 命 令 一 样 会 自动 添加 换 
行 符 ， 我 们 必须 在 需要 的 时 候 手 动 添 加 ， 比 如 在 下 面 的 脚本 中 : 


#!/bin/bash 
# 文 件 名 : printf.sh 


printf "%-5s %$-10s %-4s\n" No Name Mark 
printf "%-5s %-10s %-4.2f\n" 1 Sarath 80.3456 
printf "%-5s %-10s %-4.2f\n" 2 James 90.9989 
printf "%-5s %-10s %-4.2f\n" 3 Jeff 77.564 


我 们 会 得 到 如 下 格式 化 的 输出 : 


No Name Mark 
1 Sarath 80.35 
2 James 91.00 
3 Jeff 77.56 


1.2.2 ”工作 原理 

ss 、gc、g%d 和 gf 都 是 格式 替换 符 (format substitution character )， 其 所 对 应 的 参数 可 以 置 于 
带 引 号 的 格式 字符 串 之 后 。 

%$-5s 指 明了 一 个 格式 为 左 对 齐 且 宽度 为 5 的 字符 串 替 换 ( -表示 左 对 齐 )。 如 果 不 用 -指定 对 
齐 方式 ， 字 符 串 就 采用 右 对 齐 形式 。 宽 度 指 定 了 保留 给 某 个 变量 的 字符 数 。 对 Name 而 言 ， 保 留 
宽度 是 10。 因 此 ， 任 何 Name 字 段 的 内 容 都 会 被 显示 在 10 字 符 宽 的 保留 区 域内 ， 如 果 内 容 不 足 10 
个 字符 ， 余 下 的 则 以 空格 符 填 充 。 

对 于 浮 点 数 ， 可 以 使 用 其 他 参数 对 小 数 部 分 进行 舍 人 。 

对 于 Mark 字 段 ， 将 其 格式 化 为 s-4.2E， 其 中 .2 指定 保留 2 个 小 数位 。 注 意 ， 在 每 行 格式 字符 
串 后 都 有 一 个 换行 符 ( \n )。 














1.2.3 ”补充 内 容 


使 用 echo 和 printf 的 命令 选项 时 ， 要 确保 选项 应 该 出 现在 命令 行内 所 有 字符 串 之 前 ， 否 则 
Bash 会 将 其 视 为 另外 一 个 字符 串 。 
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1. 在 echo 中 转 义 换行 符 

在 默认 情况 下 ，echo 会 将 一 个 换行 符 妃 加 到 输出 文本 的 尾部 。 可 以 使 用 选项 -n 来 忽略 结 
的 换行 符 。echo 同 样 接受 双 引 号 字符 串 内 的 转 义 序列 作为 参数 。 如 果 需 要 使 用 转 义 序列 ， 则 采 
用 echo -e "包含 转 义 序列 的 字符 串 " 这 种 形式 。 例 如 : 





echo -e "1\t2\t3" 
1 2 3 


2. 打印 彩色 输出 
在 终端 中 生成 彩色 输出 相当 好 玩 ， 我 们 可 以 使 用 转 义 序列 来 实现 。 


每 种 颜色 都 有 对 应 的 颜色 码 。 比 如 : 重 置 =0， 黑 色 =30， 红 色 =31， 绿 色 =32， 黄 色 =33， 蓝 
色 =34， 洋 红 =35， 青 色 =36， 白 色 =37。 


要 打印 彩色 文本 ， 可 输入 如 下 命令 : 
echo -e "\e[1731m This is red text \e[Om" 
\e[17;31 将 颜色 设 为 红色 , \e[0m 将 颜色 重新 置 回 。 只 需要 将 31 替 换 成 想 要 的 颜色 码 就 可 以 了 。 


要 设置 彩色 背景 ， 经 常 使 用 的 颜色 码 是 : 重 置 =0， 黑 色 =40， 红 色 =41， 绿 色 =42 ， 黄 色 =43 ， 
蓝 色 =44， 洋 红 =45， 青 色 =46， 白 色 =47。 


要 打印 彩色 文本 ， 可 输入 如 下 命令 : 























echo -e "Ne[1742m Green Background \e[0mn 


1.3 ” 玩 转变 量 和 环境 变量 


变量 是 任何 一 种 编程 语言 都 必 不 可 少 的 组 成 部 分 , 用 于 存放 各 类 数据 。 脚 本 语言 通常 不 需要 
在 使 用 变量 之 前 声明 其 类 型 。 只 需要 直接 赋值 就 可 以 了 。 在 Bash 中 , 每 一 个 变量 的 值 都 是 字符 串 。 
无 论 你 给 变量 赋值 时 有 没有 使 用 引号 , 值 都 会 以 字符 串 的 形式 存储 。 有 一 些 特殊 的 变量 会 被 shell 
环境 和 操作 系统 环境 用 来 存储 一 些 特别 的 值 , 这 类 变量 就 被 称 为 环境 变量 。 让 我 们 来 看 一 些 实例 。 















































1.3.1 预备 知识 

变量 采用 常见 的 命名 方式 进行 命名 。 当 应 用 程序 执行 时 , 它 接收 一 组 环境 变量 。 可 以 使 用 env 
命令 查看 所 有 与 终端 相关 的 环境 变量 。 对 于 进程 来 说 ,其 运行 时 的 环境 变量 可 以 使 用 下 面 的 命令 
来 查看 : 





cat /proc/$PID/environ 
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其 中 ,将 PID 设 置 成 相关 进程 的 进程 ID ( PID 总 是 一 个 整数 )。 
假设 有 一 个 叫做 gedit 的 应 用 程序 正在 运行 。 我 们 可 以 使 用 pgrep 命 令 获 得 gedit 的 进程 ID 














$ pgrep gedit 
12501 


那么 ， 你 就 可 以 通过 以 下 命令 获得 与 该 进程 相关 的 环境 变量 : 























$ cat /proc/12501/environ 
GDM KEYBOARD LAYOUT=USGNOME KEYRING PID=1560USER=slynuxHOME=/home/slynux 


KW 环境 变量 远 不 止 这 些 , 只 是 由 于 对 页 面 篇 幅 的 限制 , 在 这 里 删除 了 其 他 很 多 

上 面 的 命令 返回 一 个 包含 环境 变量 以 及 对 应 变量 值 的 列表 。 每 一 个 变量 以 name=value 的 形 
式 来 描述 ,彼此 之 间 由 null 字 符 (\0 ) 分 隔 。 如 果 你 将 \0 替 换 成 \n， 那么 就 可 以 将 输出 重新 格式 
化 ， 使 得 每 一 行 显示 一 组 “变量 = 值 "。 替 换 可 以 使 用 tr 命令 来 实现 : 


$ cat /proc/12501/environ | tr '\0' '\n' 


现在 ， 让 我 们 看 看 怎样 对 变量 和 环境 变量 进行 赋值 及 处 理 。 








1.3.2 ”实战 演练 
变量 可 以 通过 以 下 方式 进行 赋值 : 


var=value 


var 是 变量 名 ，value 是 赋 给 变量 的 值 。 如 果 value 不 包含 任何 空白 字符 (例如 空格 )， 那 么 
它 就 不 需要 使 用 引号 进行 引用 ， 和 否则 必须 使 用 单 引 号 或 双 引 号 。 


注意 ，var = value 不 同 于 var=value。 把 var=value 写 成 var = value 是 一 个 常见 的 错误 ， 


但 前 者 是 赋值 操作 ， 后 者 则 是 相等 操作 。 
在 变量 名 之 前 加 上 $ 前 级 就 可 以 打印 出 变量 的 内 容 : 


var="value" # 给 变量 va 赋值 





























echo S$vaL 
或 者 
echo S$fvar} 


输出 如 下 : 


value 





8 第 1 章 小 试 牛刀 








我 们 可 以 在 printf 或 echo 命 令 的 双 引 号 中 引用 变量 值 。 


#!/bin/bash 

# 文 件 名 :variables .sh 

fruit=apple 

count=5 

echo "We have S$count s${fruit}(s)" 


输出 如 下 : 
We have 5 apple(s) 


环境 变量 是 未 在 当前 进程 中 定义 ， 而 从 父 进程 中 继承 而 来 的 变量 。 例 如 环境 变量 
HTTP_PROXY， 它 定义 了 忆 联网 办 代价 座 合 用 下 个 代 开 服务 各， 


该 环境 变量 通常 被 设置 成 : 


























出 








HTTP PROXY=192.168.1.23:3128 
export HTTP_ PROXY 


export 命 令 用 来 设置 环境 变量 。 至 此 之 后 ， 从 当前 shell 脚 本 执行 的 任何 应 用 程序 都 会 继承 
这 个 变量 。 我 们 可 以 按照 自己 的 需要 ,在 执行 的 应 用 程序 或 者 shell 脚 本 中 导出 特 在 默 
认 情 况 下 ， 有 很 多 标准 环境 变量 可 供 shell 使 用 。 


PATH 就 是 其 中 之 一 。 通 常 ， 变 量 PATH 包 含 : 






































$ echo $PATH 
/home/slynux/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr 
/games 


在 给 出 所 要 执行 的 命令 后 , shell 会 自动 在 PATH 环 境 变 量 所 包含 的 目录 列表 中 (各 目录 路 径 之 
间 以 冒号 分 隔 ) 查找 对 应 的 可 执行 文件 。 PATH 通 常 定义 在 /etc/environment 或 /etc/profile 或 ~/.bashrc 
中 。 如 果 需 要 在 PATH 中 添加 一 条 新 路 径 ， 可 以 使 用 : 








export PATH="$PATH: /home/user/bin" 
也 可 以 使 用 


$ PATH="$PATH: /home/user/bin" 
$ export PATH 


$ echo $PATH 


/home/slynux/bin: /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr 
/games:/home/user/bin 


这 样 ， 我 们 就 将 /home/user/bin 添 加 到 了 PATH 中 。 


还 有 一 些 众所周知 的 环境 变量 : HOME、PWD、USER、UID、SHELL 等 。 
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使 用 单 引 号 时 ， 变 量 不 会 被 扩展 〈expand )， 将 依照 原样 显示 。 这 意味 着 : co 


$ echo 'S$var' will print $var 
人 


但 如 果 变 量 var 已 经 定义 过 ， 那 么 S$ echo "$var'" 会 打印 出 该 变量 的 值 ; 
如 果 没 有 定义 过 ， 则 什么 都 不 打印 。 


1.3.3 ”补充 内 容 
让 我 们 再 多 看 些 有 关 标 准 变量 和 环境 变量 的 技巧 。 
1. 获得 字符 串 长 度 
可 以 用 下 面 的 方法 获得 变量 值 的 长 度 : 
length=$ {#var} 
例如 : 
$ var=12345678901234567890$ 


echo ${#var} 
20 


length 就 是 字符 串 所 包含 的 字符 数 。 
2. 识别 当前 所 使 用 的 shell 
可 以 用 下 面 的 方法 获知 当前 使 用 的 是 哪 种 shell: 








echo $SHELL 
也 可 以 用 

echo $0 
例如 : 


$ echo $SHELL 
/bin/bash 


$ echo $0 
/bin/bash 


3. 检查 是 否 为 超级 用 户 


UID 是 一 个 重要 的 环境 变量 ， 可 以 用 于 检查 当前 脚本 是 以 超级 用 户 还 是 以 普通 用 户 的 身份 运 
行 的 。 例 如 : 
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IE [ S$UID -ne 0 ]; then 

echo Non root user. Please run as root. 
else 

echo Root user 
pag 


root 用 户 的 UID 是 0。 





4. 修改 Bash 提 示 字 符 串 (username@hostname:~$) 


当 我 们 打开 终端 或 是 运行 shell 时 ， 会 看 到 类 似 于 userehostname: /home/S 的 提示 字符 串 。 
不 同 GNU/Linux 发 布 版 中 的 提示 及 颜色 略 有 不 同 。 我 们 可 以 利用 Ps1 环 境 变 量 来 定制 提示 文本 。 
默认 的 shell 提 示 文 本 是 在 文件 ~/ .bashrc 中 的 某 一 行 设 置 的 。 


口 可 以 使 用 如 下 命令 列 出 设置 变量 Ps1 的 那 一 行 : 








$ cat ~/.bashrc | grep PS1 
PS1l='${debian chroot:+($debian chroot)}\u@\h:\w\$ ' 


口 如 果 要 设置 一 个 定制 的 提示 字符 串 ， 可 以 输入 : 





slynux@localhost: ~$ PS1="PROMPT>" 
PROMPT> Type commands here # 提 示 字 符 串 已 经 改变 


口 我 们 可 以 利用 类 似 \e[1;31 的 特定 转 义 序列 来 设置 彩色 的 提示 字符 串 ( 参考 1.2 节 的 内 
容 )。 
还 有 一 些 特殊 的 字符 可 以 扩展 成 系统 参数 。 例 如 : \u 可 以 扩展 为 用 户 名 ，\h 可 以 扩展 为 主 
机 名 ， 而 \w 可 以 扩展 为 当前 工作 目录 。 


1.4 使 用 函数 添加 环境 变量 
环境 变量 通常 用 于 存储 路 径 列表 ， 这 些 路 径 用 于 搜索 可 执行 文件 、 库 文件 等 。 例 如 $PATH、 


Ee 


$SLD_LIBRARY_PATH， 它 们 通常 看 起 来 像 这 样 : 






































PATH=/usr/bin; /bin 
LD LIBRARY PATH=/usr/lib;/l1ib 


这 意味 着 只 要 shell 需 要 运行 二 进 制 可 执行 文件 时 ， 它 会 首先 查找 /usrbin， 然 后 是 /bin。 

当 你 必须 使 用 源 代码 编译 生成 程序 并 将 其 安装 到 某 个 特定 路 径 中 时 , 有 项 极其 常见 的 任务 就 
是 将 该 程序 的 bin 目 录 加 入 PATH 环 境 变 量 。 假 设 我 们 要 将 myapp 安 装 到 /opt/myapp， 它 的 二 进 制 文 
件 在 bin 目 录 中 ， 库 文件 在 lib 目 录 中 。 
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1.4.1 ”实战 演练 
实现 方法 如 下 : 


export PATH=/opt/myapp/bin:sPATH 
export LD LIBRARY PATH=/opt/myapp/lib;$LD LIBRARY PATH 


PATH 和 和 LD_LIBRARY_PATH 现在 看 起 来 应 该 像 这 样 : 








PATH=/opt /myapp/bin:/usr/bin:/bin 
LD LIBRARY PATH=/opt/myapp/lib: /usr/lib;/l1ib 


过 我 们 可 以 把 下 面 的 函数 加 入 .bashrc-， 让 一 切 变 得 更 轻松 些 . 
prepend() { [ -d "$2" ] && eval $1=\"$2':'\$$1\" && export $1; } 
像 下 面 这 样 来 使 用 该 函数 : 


prepend PATH /opt/myapp/bin 
prepend LD LIBRARY PATH /opt/myapp/1Lib 


1.4.2 ”工作 原理 


我 们 定义 了 名 为 prepend () 的 函数 ， 它 首先 检查 该 函数 第 二 个 参数 所 指定 的 目录 是 否 存在 
如 果 存 在 ，eval 表 达 式 将 第 一 个 参数 所 指定 的 变量 值 设置 成 第 二 个 参数 的 值 加 上 “:”( 路 径 分 隔 
符 )， 随 后 再 跟 上 首 个 参数 的 原始 值 。 


不 过 ， 有 一 点 需要 留意 。 在 进行 添加 时 ， 如 果 变 量 为 空 ， 则 会 在 未 尾 留 下 一 个 “:”。 要 解决 
这 个 问题 ， 可 以 将 该 函数 再 进行 一 些 修改 : 














prepend() { [ -d "$2" ] && eval $1=\"$2\$\{S$1:+':'\$S$1I\}\" && export $1 ; } 


在 这 个 函数 中 ,我 们 引入 了 一 种 shell 参 数 扩展 的 形式 : 


| ${parameter:+expression} 
~ 


如 果 parameter 有 值 且 不 为 空 ， 则 使 用 expression 的 值 。 


通过 这 次 修改 ， 在 追加 环境 变量 时 ， 当 且 仅 当 旧 值 存在 ， 才 会 增加 。 





1.5 ”使 用 shell 进行 数学 运算 


无 论 哪 种 编程 语言 都 少不了 算术 操作 , 在 这 则 攻略 中 , 我 们 将 会 研究 在 shell 中 进行 算术 运算 
的 各 种 方法 。 
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1.5.1 预备 知识 


在 Bash shell 环 境 中 ,可 以 利用 let、(( )) 
expr 和 bc 这 两 个 工具 也 会 非常 有 用 。 


1.5.2 


实战 演练 





和 [] 执 行 基本 的 算术 操作 。 而 在 进行 高 级 操作 时 ， 


(1) 可 以 用 普通 的 变量 赋值 方法 定义 数值 ， 这 时 ， 它 会 被 存储 为 字符 串 。 然 而 ， 我 们 可 





(2) let 命 令 可 以 直接 执行 基本 的 算术 操作 。 当 使 月 


以 用 一 些 方 法 使 它 能 像 数 字 一 样 进行 运算 。 


#!/bin/bash 
nol=4; 
no2=5; 








例如 : 


let result=nol+no2 
echo $result 


口 自 加 操作 

$ let nol+t+ 
口 自 减 操作 

$ let nol-- 
口 简写 形式 


let no+=6 
let no-=6 


它们 分 别 等 同 于 let no=no+6 和 let no=no-6。 
口 其 他 方法 
操作 符 [] 的 使 用 方法 和 1let 命 令 类 似 : 








result=$[ nol + no2 ] 
在 [中 也 可 以 使 用 $ 前 级 ,例如 : 
result=$[ $nol + 5 ] 


也 可 以 使 用 (() ) ， 但 使 用 (() ) 时 ， 变 量 名 之 前 需要 加 上 $: 








月 et 时 ， 变 量 名 之 前 不 需要 再 添加 $， 
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result=$(( nol + 50 )) Ce 


expr 同 样 可 以 用 于 基本 算术 操作 : 


result= expr 3 + 4. 
result=$ (expr $nol + 5) 


以 上 这 些 方 法 只 能 用 于 整数 运算 ， 而 不 支持 浮 点 数 。 


(3) pc 是 一 个 用 于 数学 运算 的 高 级 工具 ， 这 个 精密 计算 器 包含 了 大 量 的 选项 。 我 们 可 以 
借助 它 执行 浮 点 数 运算 并 应 用 一 些 高 级 函数 : 


echo "4 * 0.56" | bc 














2.24 

no=54; 

result=‘echo "$no * 1.5" | bc 
echo $result 

81.0 


ll a 同时 以 分 号 作为 定 界 符 ， 通过 stqin 传 

圳 给 bc。 

口 设 定 小 数 精度 。 在 下 面 的 例子 中 ， 参 数 scale=2 将 小 数位 个 数 设置 为 2。 因 此 ， 
bc 将 会 输出 包含 两 个 小 数位 的 数值 。 


echo "scale=2;3/8" | bc 
0.37 


口 进 制 转换 。 用 bc 可 以 将 一 种 进 制 系统 转换 为 另 一 种 。 来 看 看 如 何 将 十 进 制 转换 成 
二 进 制 ， 然 后 再 将 二 进 制 转换 回 十 进 制 : 


#!/bin/bash 
用 途 : 数字 转换 








no=100 

echo "obase=2;$no" | bc 

1100100 

no=1100100 

echo "obase=10;ibase=2;$no" | bc 
100 


口 计算 平方 以 及 平方 根 。 


echo "sqrt(100)" | bc #Square root 
echo "10^10" | bc #Square 
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1.6” 玩 转 文 件 描述 符 及 重 定 向 


文件 描述 符 是 与 文件 输入 、 输 出 相关 联 的 整数 。 它 们 用 来 跟踪 已 打开 的 文件 。 最 常见 的 文件 
描述 符 是 stain、stdout 和 stderr。 我 们 甚至 可 以 将 某 个 文件 描述 符 的 内 容重 定向 到 男 一 个 文 
件 描述 符 中 。 下 面 给 出 一 些 对 文件 描述 符 进行 操作 和 重 定向 的 例子 。 

















1.6.1 预备 知识 


在 编写 脚本 的 时 候 会 频繁 使 用 标准 输入 ( stain )、 标 准 输 出 ( stqout ) 和 标准 错误 
( stderr )。 通 过 内 容 过 滤 将 输出 重 定向 到 文件 是 我 们 平日 里 的 基本 任务 之 一 。 当 命令 输出 文本 
时 ,这 些 输 出 文本 有 可 能 是 错误 信息 ， 也 可 能 是 正常 的 ( 非 错误 的 ) 输出 信息 。 单 靠 查看 输出 的 
文本 本 身 ， 我们 没 法 区 分 哪些 是 正常 ， 哪 些 是 错误 。 不 过 可 以 通过 文件 描述 符 来 解决 这 个 问题 ， 
将 那些 与 特定 描述 符 关 联 的 文本 提取 出 来 。 


文件 描述 符 是 与 入 个 打开 的 文件 或 数据 流 相 关联 的 整数 ,文件 描述 符 0、1 以 及 2 是 系统 预 留 的 。 









































Do stdin (标准 输入 )。 
口 1 stdout (标准 输出 )。 
D2 stderr (标准 错误 )。 








1.6.2 ”实战 演练 
(1) 用 下 面 的 方法 可 以 将 输出 文本 重 定向 或 保存 到 一 个 文件 中 : 
$ echo "This is a sample text 1" > temp.txt 
这 种 方法 通过 截断 文件 的 方式 ， 将 输出 文本 存储 到 文件 temp.txt 中 ， 也 就 是 说 在 把 
echo 命 令 的 输出 写 入 文件 之 前 ，temp.txt 中 的 内 容 首 先 会 被 清空 。 


(2) 将 文本 追加 到 目标 文件 中 ， 看 下 面 的 例子 : 




















$ echo "This is sample text 2" >> 七 emp .七 xt 
(3) 查看 文件 内 容 : 


$ cat temp.txt 
This is sample text 1 
This is sample text 2 


(4) 来 看 看 什么 是 标准 错误 以 及 如 何 对 它 重 定向 。 当 命令 输出 错误 信息 时 ，stderr 信 息 
就 会 被 打印 出 来 。 考 虑 下 面 的 例子 : 
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$ 1S + 
1s: cannot access +: No such file or directory 


这 里 ，+ 是 一 个 非法 参数 ， 因 此 将 返回 错误 信息 。 




















成 功 和 不 成 功 的 命令 
U 
I 当 一 个 命令 发 生 错误 并 退回 时 ， 它 会 返回 一 个 非 0 的 退出 状态 
当 命 令 成 功 完成 后 ， 它 会 返回 数字 0。 en 


ee 之 后 立刻 运行 echo $?, 就 可 以 打印 出 退出 状态 )。 











下 面 的 命令 会 将 stderr 文 本 打印 到 屏幕 上 , 而 不 是 文件 中 ( 而且 因为 并 没有 stdout 
的 输出 ， 所 以 out.txt 没 有 内 容 ): 


$ ls + > out.txt 
1s: cannot access +: No such file or directory 


下 面 的 命令 中 ,我 们 将 stderz 重 定向 到 out.txt: 

$ ls + 2> out.txt # 正 常 运行 

你 可 以 将 stderz 单 独 重 定向 到 一 个 文件 ， 将 stdqout 重 定向 到 另 一 个 文件 : 
$ cmd 2>stderr.txt 1>Sstdout .七 zt 


还 可 以 利用 下 面 这 个 更 好 的 方法 将 stderr 转 换 成 stdout ， 使 得 stderr 和 stdout 
都 被 重 定 向 到 同一 个 文件 中 : 
$ cmd 2>&1 output.txt 
或 者 这 样 : 
$ cmd &> output.txt 

(5) 有 了 时候， 在 输出 中 可 能 包含 一 些 不 必要 的 信息 ( 比如 调试 信息 )。 如 果 你 不 想 让 终端 
中 充斥 着 有 关 stderr 的 繁 枝 术 节 ， 那 么 你 可 以 将 staqerr 的 输出 重 定向 到 /dev/null， 
保证 一 切 都 会 被 清除 得 二 干净 净 。 假设 我 们 有 3 个 文件 ， 分 别 是 al 、a2 、a3。 但 是 普 
通用 户 对 文件 al 没有 “ 读 - 写 -执行 ”权限 。 如 果 需 要 打印 文件 名 以 a 起 始 的 所 有 文件 
的 内 容 ， 可 以 使 用 cat 命 令 。 设 置 一 些 测试 文件 : 

















$ echo al > al 

$ cp al a2 ; cp a2 a3; 

$ chmod 000 al # 清 除 所 有 权限 

尽管 可 以 使 用 通配符 (a* ) 显示 所 有 的 文件 内 容 ， 但 是 系统 会 显示 一 个 出 错 信息 ， 
因为 对 文件 al 没有 可 读 权 限 。 
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$ cat a* 

cat: al: Permission denied 
al 

al 


其 中 ，cat: al: Permission denied 属 于 stderr。 我 们 可 以 将 stderr 信 息 重 定向 
到 一 个 文件 中 ， 而 stdout 仍 然 保 持 不 变 。 考 虑 如 下 代码 : 
$ cat a* 2> err.txt # stderr 被 重 定向 到 err.txt 


al 
al 


$ cat err.txt 
cat: al: Permission denied 


观察 下 面 的 代码 : 

$ cmd 2>/dev/null 
当 对 如 果 对 stderz 或 stdout 进 行 重 定向 ， 被 重 定向 的 文本 会 传人 文件 。 因 为 文本 
已 经 被 重 定向 到 文件 中 , 也 就 没 剩 下 什么 东西 可 以 通过 管道 ( | ) 传 给 接 下 来 的 命令 ， 
而 这 些 命令 是 通过 stdin 进 行 接收 的 。 


















































(6) 但 是 有 一 个 方法 既 可 以 将 数据 重 定 向 到 文件 ， 还 可 以 提供 一 份 重 定向 数据 的 副本 作 


为 后 续 命 令 的 stdin。 这 一 切 都 可 以 使 用 Fee 来 实现 。 举 个 例子 : 要 在 终端 中 打印 
stdout， 同 时 将 它 重 定向 到 一 个 文件 中 ,那么 可 以 这 样 使 用 ree: 





command | tee FILE1 FILE2 

在 下 面 的 代码 中 ，tee 命 令 接收 到 来 自 stain 的 数据 。 它 将 staout 的 一 份 副本 写 和 人 
文件 out.tkt， 同 时 将 另 一 份 副本 作为 后 续 命 令 的 stdin。 命 令 cat -n 将 从 stdin 中 接 
收 到 的 每 一 行 数据 前 加 上 行 号 并 写 人 stdout: 





$ cat ax | tee out.txt | cat -n 
cat: al: Permission denied 

lal 

2al 


查看 out.txt 的 内 容 : 





$ cat out.txt 

al 

al 

注意 ，cat: al: Permission denied 并 没有 在 文件 内 容 中 出 现 。 这 是 因为 这 些 
言 息 属于 stderr， 而 tee 只 能 从 stdin 中 读 取 。 














[uy 
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默认 情况 下 ，tee 命 令 会 将 文件 覆盖 ,但 它 提供 了 一 个 -a 选项 ， 用 于 追加 内 容 。 例 


如 : $ cat ax | tee -a out.txt | cat -no 


带 有 参数 的 命令 可 以 写成 : commanqd FILE1 FILE2.. 或 者 就 简单 的 使 用 command 
FILE。 


(7) 我 们 可 以 使 用 stain 作 为 命令 参数 。 只 需要 将 -作为 命令 的 文件 名 参数 即 可 : 





as 


$ cmdl | cmd2 | cmd - 
例如 : 


$ echo who is this | tee - 
who is this 
who is this 


也 可 以 将 /devwstdin 作 为 输出 文件 名 来 代替 stain。 


类 似 地 ， 使 用 /dev/stderr 代 表 标 准 错误 ，/dev/stdout 代 表 标 准 输 出 。 这 些 特殊 的 设备 
文件 分 别 对 应 stain、stqerr 和 stdout。 





1.6.3 工作 原理 


就 输出 重 定 向 而 言 ，> 和 >> 并 不 相同 。 尽 管 两 者 可 以 将 文本 重 定向 到 文件 ， 但 是 前 者 会 先 清 
空 文件 ， 然 后 再 写 和 内容 ， 而 后 者 会 将 内 容 追 加 到 现 有 文件 的 尾部 。 

当 使 用 重 定 向 操作 符 时 ,输出 内 容 不 会 在 终端 打印 ， 而 是 被 导向 文件 。 重 定向 操作 符 默 认 使 
用 标准 输出 。 如 果 想 使 用 特定 的 文件 描述 符 ， 你 必须 将 描述 符 编号 置 于 操作 符 之 前 。 





























> 等 同 于 1>; 对 于 >> 来 说 ， 情 况 也 类 似 ( 即 >> 等 同 于 1>> )。 

处 理 错误 时 , 来 自 stdqerr 的 输出 被 丢弃 到 文件 /dev/null 中 。/dev/null 是 一 个 特殊 的 设备 文件 ， 
它 接收 到 的 任何 数据 都 会 被 丢弃 。null 设 备 通常 也 被 称 为 黑洞 ， 因 为 凡是 到 这 儿 的 数据 都 将 一 去 
不 返 。 




















1.6.4 补充 内 容 
从 stdin 读 取 输 入 的 命令 能 以 多 种 方式 接收 数据 。 也 可 以 用 cat 和 管道 来 指定 我 们 自己 的 文 
件 描述 符 ， 例 如 : 


$ cat file | cmd 
$ cmdl | cmd 
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1. 将 文件 重 定 向 到 命令 
借助 重 定 向 ,我 们 可 以 像 使 用 stain 那 样 从 文件 中 读 取 数据 : 








$ cmd < file 
2. 将 脚本 内 部 的 文本 块 进行 重 定向 
有 时 候 , 我 们 需要 对 文本 块 (多 行文 本 ) 进行 重 定向 ， 就 像 对 标准 输入 做 的 那样 。 考 虑 一 个 





特殊 情况 : 源 文 本 就 位 于 shell 脚 本 中 。 一 个 实用 的 例子 是 向 log 文 件 中 写 和 人 头 部 数据 , 可 以 按照 下 
面 的 方法 完成 : 





#!/bin/bash 
Cat<<EOF>l10og.txt 

LOG FILE HEADER 

This is a test log file 
Function: System statistics 
EOF 


在 cat <<EOF>1log .txt 与 下 一 个 EOF 行 之 间 的 所 有 文本 行 都 会 被 当做 stdin 数 据 。log.txt 




















文件 的 内 容 打 印 如 下 : 


$ cat log.txt 

LOG FILE HEADER 

This is a test log file 
Function: System statistics 


3. 自 定义 文件 描述 符 
文件 描述 符 是 一 种 用 于 访问 文件 的 抽象 指示 器 ( abstract indicator )。 存 取 文 件 离 不 开 被 称 为 

















“文件 描述 符 ” 的 特殊 数字 。0、1 和 2 分 别 是 stdain、stdout 和 stqerr 的 预 留 描述 符 编号 。 








我 们 可 以 使 用 exec 命 令 创 建 自己 的 文件 描述 符 。 如 果 你 对 用 其 他 编程 语言 进行 文件 编程 非 





常熟 悉 ， 你 可 能 已 经 注意 到 了 文件 打开 模式 。 通 常会 用 到 3 种 模式 。 


口 只 读 模式 。 

口 截断 写 入 模式 。 

口 追加 写 入 模式 。 

< 操作 符 用 于 从 文件 中 读 取 至 stain。> 操作 符 用 于 截断 模式 的 文件 写 和 信 数据 在 目标 文件 





内 容 被 截断 之 后 写 入 )。>> 操 作 符 用 于 追加 模式 的 文件 写 入 。( 数据 被 添加 到 文件 的 现 有 内 容 中 ， 











而 且 该 目标 文件 中 原 有 的 内 容 不 会 丢失 。) 文 件 描述 符 可 以 用 以 上 三 种 模式 中 的 任意 一 种 来 创建 。 


创建 一 个 文件 描述 符 进 行文 件 读 取 : 


$ exec 3<input.txt # 使 用 文件 描述 符 3 打 开 并 读 取 文 件 
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我 们 可 以 这 样 使 用 它 : 





$ echo this is a test line > input.txt 
$ exec 3<input.txt 


现在 你 就 可 以 在 命令 中 使 用 文件 描述 符 3 了 。 例 如 : 


$ cat<&3 
this is a test line 


如 果 要 再 次 读 取 ,我 们 就 不 能 继续 使 用 文件 描述 符 3 了 ， 而 是 需要 用 exec 重 新 分 配 文件 描述 
符 3 来 进行 二 次 读 取 。 

创建 一 个 文件 描述 符 用 于 写 入 ( 截断 模式 ): 

$ exec 4>output .txt #4 打开 文件 进行 写 入 


例如 : 





$ exec 4>output .txt 
$ echo newline >&4 
$ cat output .txt 
newline 


创建 一 个 文件 描述 符 用 于 写 入 ( 追加 模式 ): 





$ exec 5>>input.txt 
例如 : 


$ exec 5>>input.txt 

$ echo appended line >&5 
$ cat input.txt 

newline 

appended line 


1.7 数组 和 关联 数组 


数组 是 shell 脚 本 非常 重要 的 组 成 部 分 ， 它 借助 索引 将 多 个 独立 的 数据 存储 为 一 个 集合 。 普 通 
数组 只 能 使 用 整数 作为 数组 索引 。Bash 也 支持 关联 数组 ， 它 可 以 使 用 字符 串 作 为 数组 索引 。 在 很 
多 情况 下 ,采用 字符 串 式 索引 更 容易 理解 ， 这 时 候 关 联 数组 就 派 上 用 场 了 。 在 这 里 ,我 们 会 看 到 
普通 数组 和 关联 数组 的 用 法 。 




















1.7.1 预备 知识 
Bash 从 4.0 版 本 之 后 才 开始 支持 关联 数组 。 
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1.7.2 


实战 演练 
(1) 定义 数组 的 方法 有 很 多 种 。 可 以 在 单行 中 使 用 一 列 值 来 定义 一 个 数组 : 


array var=(1 2 3 4 5 6) 
# 这 些 值 将 会 存储 在 以 0 为 起 始 索 引 的 连续 位 置 上 


另外 ， 还 可 以 将 数组 定义 成 一 组 “索引 - 值 ”: 


array var[0]="testl1" 
array_ var[1l]="test2" 
array var[2]="test3" 
array_ var[3]="test4" 
array_ var[4]="test5" 
array_ var[5]="test6" 


C) 打印 出 特定 索引 的 数组 元 素 内 容 : 


echo $t{array var[0]} 
test1 

index=5 

echo ${array var[$index]} 
test6 


(3) 以 清单 形式 打印 出 数组 中 的 所 有 值 : 





$ echo S$farray_ var[*]} 
teSst1L test2 test3 test4 test5 test6 


也 可 以 这 样 使 用 : 


$ echo $s{array var[@]} 
test1 test2 test3 test4 test5 test6 


(4) 打印 数组 长 度 ( 即 数组 中 元 素 的 个 数 ): 


$ echo ${#array var[*]} 
6 


1.7.3 ”补充 内 容 


y 





关联 数组 从 Bash 4.0 版 本 开始 被 引入 。 借 助 散 列 技术 ， 关 联 数组 成 为 解决 很 多 问题 的 有 力 工 
i。 接 下 来 就 让 我 们 一 探究 况 。 

1. 定义 关联 数组 

在 关联 数组 中 , 我 们 可 以 用 任意 的 文本 作为 数组 索引 。 首 先 , 需要 使 用 声明 语句 将 一 个 变量 





名 声明 为 关联 数组 。 像 下 面 这 样 : 
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$ declare -A ass array Ce 
声明 之 后 ， 可 以 用 两 种 方法 将 元 素 添加 到 关联 数组 中 。 
口 利用 内 柑 “ 索 引 - 值 ” 列 表 的 方法 ， 提 供 一 个 “索引 - 值 ”列表 : 








$ ass array=([index1]=vall [index2]=val2) 
口 使 用 独立 的 “索引 - 值 ” 进 行 赋值 : 


$ ass array[index1] =vall 
$ ass array'index2]=val2 


举 个 例子 ,试想 如 何 用 关联 数组 为 水 果 制 定价 格 : 


$ declare -A fruits value 
$ fruits value=([apple]='100dollars' [orange]='150 dollars') 


用 下 面 的 方法 显示 数组 内 容 : 


$ echo "Apple costs S${fruits value[apple]}" 
Apple costs 100 dollars 


2. 列 出 数组 索引 

每 一 个 数组 元 素 都 有 一 个 索引 用 于 查找 。 普 通 数组 和 关联 数组 具有 不 同 的 索引 类 型 。 我 们 可 
以 用 下 面 的 方法 获取 数组 的 索引 列表 : 

$ echo ${!array var[*]} 

也 可 以 使 用 : 

$ echo ${!array var[@] 

以 先前 提 到 的 fruits_value 数 组 为 例 ， 运 行 如 下 命令 : 


$ echo s${!fruits value[*]} 
orange apple 


对 于 普通 数组 ， 这 个 方法 同样 可 行 。 














1.8 使 用 别名 


别名 就 是 一 种 便捷 方式 , 以 省 去 用 户 输入 一 长 串 命令 序列 的 麻烦 。 下 面 我 们 会 看 到 如 何 使 用 
alias 命 令 创 建 别名 。 





1.8.1 实战 演练 
你 可 以 利用 别名 进行 多 种 操作 ， 如 下 所 示 。 
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(1) 可 以 按照 下 面 的 方式 创建 一 个 别名 : 


$ alias new command='command sequence' 





为 安装 命令 apt-get install 创 建 别 名 : 
$ alias install='sudo apt-get install' 
这 样 一 来 ， 我 们 就 可 以 用 install pidgin 代 蔡 sudo apt-get install pidgin 了 。 


(2) alias 命 令 的 作用 只 是 暂时 的 。 一 旦 关闭 当前 终端 ， 所 有 设置 过 的 别名 就 失效 了 。 
为 了 使 别名 设置 一 直 保持 作用 ， 可 以 将 它 放 人 ~/ .bashrc 文 件 中 。 因 为 每 当 一 个 新 
的 shell 进 程 生成 时 ， 都 会 执行 ~/.bashrc 中 的 命令 。 








$ echo 'alias cmd="command seq"' >> ~/.bashrc 


(3) 如 果 需 要 删除 别名 ， 只 用 将 其 对 应 的 语句 ( 如 果 有 的 话 ) 从 ~/ .bashrc 中 删除 ， 
或 者 使 用 unalias 命 邻 。 或 者 使 用 alias example=， 这 会 取消 名 为 example 
的 别名 。 


(4) 我 们 可 以 创建 一 个 别名 rm， 它 能 够 删除 原始 文件 ， 同 时 在 backup 目 录 中 保留 副本 : 











alias rm='cp $@ ~/backup && rm s$@' 


创建 别名 时 ,如 果 已 经 有 同名 的 别名 存在 , 那么 原 有 的 别名 设置 将 被 新 的 设 
一 置 取代 。 


1.8.2 ”补充 内 容 

有 了 时 别名 也 会 造成 安全 问题 。 下 面 来 看 看 应 该 如 何 识别 这 些 隐患 。 

对 别名 进行 转 义 

alias 命 令 能 够 为 任何 重要 的 命令 创建 别名 ， 不 过 你 未 必 总 是 希望 用 别名 来 执行 这 个 命令 。 
我 们 可 以 将 希望 使 用 的 命令 进行 转 义 ， 从 而 忽略 当前 定义 的 别名 。 例 如 ; 

$ \command 


字符 \ 对 命令 实施 转 义 ， 使 我 们 可 以 执行 原本 的 命令 ， 而 不 是 这 些 命令 的 别名 替身 。 在 不 可 
信 环 境 下 执行 特权 命令 ， 通 过 在 命令 前 加 上 、 来 忽略 可 能 存在 的 别名 设置 总 是 一 个 不 错 的 安全 
实践 。 因 为 攻击 者 可 能 已 经 将 一 些 别 有 用 心 的 命令 利用 别名 伪装 成 了 特权 命令 , 借 此 来 盗 取 用 户 
输入 的 重要 信息 。 
































1.9 获取 终端 信息 


编写 命令 行 shell 脚 本 时 ， 总 是 免不了 大 量 处 理 当 前 终端 的 相关 信息 ， 比 如 行 数 、 列 数 、 光 标 
位 置 、 密 人 码 字段 等 。 这 则 攻略 将 帮助 你 学 习 如 何 采集 和 处 理 终端 设置 。 








1.9.1 预备 知识 
tput 和 stty 是 两 款 终端 处 理工 具 。 下 面 来 看 看 如 何 用 它们 完成 各 种 不 同 的 任务 。 





1.9.2 ”实战 演练 
口 获取 终端 的 行 数 和 列 数 : 


tput cols 
tput lines 


口 打印 出 当前 终端 名 : 
tput longname 

口 将 光标 移动 到 坐标 (100,100) 处 : 
tput cup 100 100 


口 设置 终端 背景 色 : 





tputsetb n 
其 中 ，n 可 以 在 0 到 7 之 间 取 值 。 
口 设置 文本 前 景 





tputsetf n 

其 中 ，n 可 以 在 0 到 7 之 间 取 值 。 
口 设置 文本 样式 为 粗 体 : 

tput bold 


口 设置 下 划 线 的 起 止 : 





tput smul 
tput rmul 


口 删除 从 当前 光标 位 置 到 行 尾 的 所 有 内 容 : 





tputed 
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口 在 输入 密码 时 ， 不 应 该 显示 输入 内 容 。 在 下 面 的 例子 中 ， 我 们 将 看 到 如 何 使 用 stty 来 实 
现 这 一 要 求 : 


#!/bin/sh 
#Filename: password.sh 





echo -e "Enter password: " 
stty -echo 

read password 

stty echo 

echo 

echo Password read. 


| 选项 -echo 禁 止 将 输出 发 送 到 终端 ， 而 选项 echo 则 允许 发 送 输出 。 | 


1.10 获取、 设置 日 期 和 延 时 


很 多 应 用 程序 需要 以 不 同 的 格式 打印 日 期 、 设 置 日 期 和 时 间 、 根 据 日 斯 和 时 间 执 行 操作 。 延 
时 通常 用 于 在 程序 执行 过 程 中 提供 一 段 等 待 时 间 ( 比如 1 秒 ), 例如 需要 在 脚本 中 对 某 项 任务 每 隔 
5 秒 监视 一 次 ， 就 需要 知道 如 何在 程序 中 加 入 延 时 。 这 则 攻略 会 告诉 你 怎么 处 理 日 期 以 及 延 时 。 



































1.10.1 预备 知识 

我 们 能 够 以 多 种 格式 打印 日 期 ,也 可 以 在 命令 行 中 设置 日 期 。 在 类 Unix 系 统 中 ， 日 期 被 存储 
成 一 个 整数 ， 其 大 小 为 自 世 界 标 准时 间 (UTC ) "1970 年 1 月 1 日 0 时 0 分 0 秒 ? 起 所 流逝 的 秒 数 。 这 
种 计时 方式 称 为 纪元 时 或 Unix 时 间 。 来 看 看 对 其 进行 读 取 和 设置 的 方式 。 





1.10.2 ”实战 演练 
可 以 使 用 不 同 的 格式 来 读 取 、 设 置 日 期 。 实 现 步 骤 如 下 所 示 。 
(D 读 取 日 期 : 


$ date 
Thu May 20 23:09:04 IST 2010 


(2) 打印 纪元 时 : 


$ date +%s 
1290047248 











@ UTC (Coordinated Universal Time )， 又 称 世 界 标准 时 间或 世界 协调 时 间 。UTC 是 以 原子 时 秒 长 为 基础 ， 在 时 刻 上 
尽量 接近 于 世界 时 的 一 种 时 间 计 量 系统 。 


@ Unix 认 为 UTC 1970 年 1 月 1 日 0 点 是 纪元 时 间 。POSIX 标 准 推出 后 ， 这 个 时 间 也 被 称 为 POSIX 时 间 。 
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我 们 可 以 从 给 定格 式 的 日 期 串 中 得 出 对 应 的 纪年 时 。 在 输入 时 有 多 种 日 期 格式 可 供 et 
选择 。 如 果 要 从 系统 日 志 中 或 者 其 他 标准 应 用 程序 生成 的 输出 中 获取 日 期 ， 那 就 完 
全 不 用 上 烦心 日 期 串 格式 的 问题 。 要 将 日 期 串 转换 成 纪元 时 ， 只 需要 这 样 即 可 实现 


$ date --date "Thu Nov 18 08:07:21 IST 2010" +%s 
1290047841 


选项 --aate 用 于 提供 日 期 串 作 为 输入 。 但 我 们 可 以 使 用 任意 的 日 期 格式 化 选项 来 打 
印 输出 。 将 日 期 串 作 为 输入 能 够 用 来 获知 给 定 的 日 期 是 星期 几 。 


例如 : 








$ date --date "Jan 20 2001" +%A 
Saturday 


表 1-1 是 一 份 日 期 格式 字符 串 列表 。 


(3) 用 格式 串 结合 + 作为 aate 命 令 的 参数 ， 可 以 按照 你 的 选择 打印 出 对 应 格式 的 日 期 。 
例如 : 


$ date "+%d %B %Y" 
20 May 2010 


(4) 设置 日 斯 和 时 间 : 
# date -s "格式 化 的 日 期 字符 囊 " 
例如 : 


# date -s "21 June 2009 11:01:22" 
(5) 有 时 候 ， 我 们 需要 检查 一 组 命令 所 花费 的 时 间 ， 可 以 使 用 以 下 代码 : 


#!1/bin/bash 

# 文 件 名 : time_take.sh 
start=$ (date +%s) 
commands; 








statements; 


end=$ (date +%s) 
difference=$(( end - start)) 
echo Time taken to execute commands is S$difference seconds. 


另 一 种 方法 则 是 使 用 ime<scriptpath> 来 得 到 执行 脚本 所 花 
~ 全 费 的 时 间 。 
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1.10.3 工作 原理 


纪元 时 被 定义 为 从 世界 标准 时 间 1970 年 1 月 1 日 0 时 0 分 0 秒 起 至 当前 时 刻 的 总 秒 数 ， 不 包括 闽 
秒 "。 当 计算 两 个 日 期 或 两 段 时 间 的 差 值 时 ， 纪 元 时 很 有 用 处 。 你 可 以 得 出 两 个 特定 时 间 戳 的 纪 
元 时 间 ， 并 计算 出 两 者 之 间 的 差 值 ， 由 此 就 能 知道 两 个 日 期 之 间 相隔 了 多 少 秒 。 


利用 日 期 格式 来 获得 所 需要 的 输出 ， 可 以 参考 表 1-1。 

































































表 1-1 
日 期 内 容 格 式 

星期 sa (例如 : Sat) 

%A (例如 : Saturday) 

sb (例如: Nov) 
本 %B (例如 : November) 
日 sq (例如 : 31) 
固定 格式 日 期 (mm/dd/yy) sD (例如 : 10/18/10) 
sy (例如 : 10) 

sY (例如 : 2010) 
小 时 $I 或 $8H (例如 : 08) 
分 钟 %M (例如 : 33) 
秒 sS (例如 : 10) 
纳 秒 %$N (例如 : 695208515) 
Unix 纪 元 时 (以 秒 为 单位 ) ss (例如 : 1290049486) 





1.10.4 ”补充 内 容 

















编写 以 循环 方式 运行 的 监视 脚本 时 ,设置 时 间 间 隅 是 必 不 可 少 的 。 让 我 们 来 看 看 如 何 生成 延 时 。 


在 脚本 中 生成 延 时 


为 了 在 脚本 中 推迟 执行 一 段 时 间 ， 可 以 使 用 sleep: $ sleep no_of_seconds. 例 如 ,下 面 
的 脚本 就 使 用 tput 和 sleep 从 0 开始 计数 到 40: 





#!/bin/bash 

# 文 件 名 : sleep.sh 
echo -n Count: 
tput sc 


全 On 七 三 站 和 
while true; 
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do 
if [ $count -lt 40 ]; 


then 
let count++; 








sleep 1; 
But Ee 
tput ed 
echo -n $count; 
else exit 0; 
生生 
done 


在 上 面 的 例子 中 , 变量 count 初 始 化 为 0， 随 后 每 循环 一 次 便 增 加 1。echo 语 名 打印 出 count 
的 值 。 我 们 用 tput sc 存储 光标 位 置 。 在 每 次 循环 中 ， 通 过 恢复 之 前 存储 的 光标 位 置 ， 在 终端 中 
打印 出 新 的 count 值 。 恢 复 光标 位 置 的 命令 是 tput rc。tput eq 清除 从 当前 光标 位 置 到 行 尾 之 
间 的 所 有 内 容 ， 使 得 旧 的 count 值 可 以 被 清除 并 写 和 人 新 值 。 循 环 内 的 1 秒 钟 延 时 是 通过 sleep 命 
令 来 实现 的 。 














1.11 调试 脚本 


调试 功能 是 每 一 种 编程 语言 都 应 该 实现 的 重要 特性 之 一 ， 当 出 现 一 些 始 料 未 及 的 情况 时 , 用 
它 来 生成 脚本 运行 信息 。 调 试 信息 可 以 帮 你 弄 清 楚 是 什么 原因 使 得 程序 发 生前 省 或 行为 异常 。 每 
位 系统 程序 员 都 应 该 了 解 Bash 提 供 的 调试 选项 。 




















1.11.1 实战 演练 
我 们 可 以 利用 Bash 内 建 的 调试 工具 ， 或 者 按照 易于 调试 的 方式 编写 脚本 ， 方 法 如 下 所 示 。 
(1) 使 用 选项 -x， 启 用 shell 脚 本 的 跟踪 调试 功能 : 
$ bash -x script.sh 


运行 带 有 -x 标志 的 脚本 可 以 打印 出 所 执行 的 每 一 行 命令 以 及 当前 状态 。 注 意 ， 你 也 
可 以 使 用 sh -x script。 


(2) 使 用 set -x 和 set +x 对 脚本 进行 部 分 调试 。 例 如 : 


#!/bin/bash 

# 文 件 名 : debug.sh 
for 和 Tm (L0606}; 
do 








set -x 
echo $i 
set +x 
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done 
echo "Script executed" 


在 上 面 的 脚本 中 ， 只 会 打印 出 echoe $i 的 调试 信息 ， 因 为 使 用 了 -x 和 +x 对 调试 区 域 
进行 了 限制 。 

(3) 前 面 介绍 的 调试 手段 是 Bash 内 建 的 。 它 们 通常 以 固定 的 格式 生成 调试 信息 。 但 是 在 
很 多 情况 下 ， 我 们 需要 以 自 定义 格式 显示 调试 信息 。 这 可 以 通过 传递 _DEBUG 环 境 
变量 来 建立 这 类 调试 风格 。 

请 看 下 面 的 代码 : 


#!/bin/bash 
function DEBUG () 
{ 



































[ "$_DEBUG" == "on" ] && $@ || : 
} 
fOr 和 Tn {ln L108 
do 
DEBUG echo $i 
done 


可 以 将 调试 功能 置 为 "on" 来 运行 上 面 的 脚本 : 





$ _DEBUG=on ./script.sh 


我 们 在 每 一 个 需要 打印 调试 信息 的 语句 前 加 上 DEBUG。 如 果 没 有 把 _DEBUG=on 传 递 
给 脚本 ,那么 调试 信息 就 不 会 打印 出 来 。 在 Bash 中 ， 命令“:” 告 诉 shell 不 要 进行 任 
何 操 作 。 














1.11.2 ”工作 原理 


-x 标 识 将 脚本 中 执行 过 的 每 一 行 都 输出 到 stdout。 不 过 ， 我 们 也 可 能 只 关注 脚本 某 些 部 分 
的 命令 及 参数 的 打印 输出 。 针 对 这 种 情况 ， 可 以 在 脚本 中 使 用 set builtin 来 启用 或 禁止 调试 
打印 。 


D set -x: 在 执行 时 显示 参数 和 命令 。 
口 set +x: 禁止 调试 。 

口 set -v: 当 命令 进行 读 取 时 显示 输入 。 
口 set +v: 禁止 打印 输入 。 








1.11.3 ”补充 内 容 
还 有 其 他 脚本 调试 的 便捷 方法 ， 我 们 甚至 可 以 巧妙 地 利用 shebang 来 进行 调试 。 
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shebang 的 妙用 
把 shebang 从 #1/bin/bash 改 成 #!1/bin/bash -xv， 这 样 一 来 ， 不 用 任何 其 他 选项 就 可 以 





启用 调试 功能 了 。 


1.12 ”函数 和 参数 
和 其 他 脚本 语言 一 样 ，Bash 同 样 支持 函数 。 让 我 们 看 看 它 是 如 何 定 义 和 使 用 函数 的 。 


1.12.1 实战 演练 
我 们 可 以 创建 执行 特定 任务 的 函数 ， 也 可 以 创建 能 够 接受 参数 的 函数 。 方 法 如 下 所 示 。 
(1) 定义 函数 : 


function fname() 
{ 
statements; 


上 
或 者 : 


fname () 
{ 
statements; 


} 

(2) 只 需要 使 用 函数 名 就 可 以 调用 某 个 函数 : 
$ fname ; # 执 行 函 数 

(3) 参数 可 以 传递 给 函数 ， 并 由 脚本 进行 访问 : 
fname arg1l arg2 ; # 传 递 参数 


以 下 是 函数 Ename 的 定义 。 在 函数 fname 中 ， 包 含 了 各 种 访问 函数 参数 的 方法 。 




















fname () 

{ 
echo $1，$2; # 访 问 参 数 1 和 参数 2 
echo "$@";# 以 列表 的 方式 一 次 性 打印 所 有 参数 
echo "$*"; # 类 似 于 $S@， 但 是 参数 被 作为 单个 实体 
return 0; # 返 回 值 

} 


类 似 地 ， 参 数 可 以 传递 给 脚本 并 通过 script :$0 (脚本 名 ) 访问 。 
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口 $1 是 第 一 个 参数 。 

口 $2 是 第 二 个 参数 。 

口 $n 是 第 n 个 参数 。 

口 "se" 被 扩展 成 "$1" "$2" "$3" 等 。 

口 "$*" 被 扩展 成 "$1c$2c$3"， 其 中 c 是 IFS 的 第 一 个 字符 。 

口 "$e@" 要 比 "$*" 用 得 多 。 由 于 "$*" 将 所 有 的 参数 当做 单个 字符 串 ， 因 此 它 很 少 被 
使 用 。 








1.12.2 补充 内 容 
让 我 们 再 研究 一 些 Bash 函 数 的 技巧 。 
1. 递归 函数 
在 Bash 中 ， 函 数 同样 支持 递归 ( 可 以 调用 自身 的 函数 )。 例 如 ，F() { echo $1; F hello; 


sleep 1; }。 





Fork 炸 弹 

:OF :|:g };: 

这 个 递归 函数 能 够 调用 自身 ,不断 地 生成 新 的 进程 ,最 终 造 成 拒绝 服务 

人 攻击 。 函 数 调 用 前 的 & 将 子 进程 放 入 后 台 。 这 上 段 危 险 的 代码 会 分 支出 大 量 的 
A 进程 ， 因 而 称 为 Fork 炸 弹 。 

上 面 这 段 代 码 要 理解 起 来 可 不 容易 。 请 参阅 维基 百科 http://en.wikipedia. 
org/wiki/Fork bomb， 那 里 列 出 了 有 关 Fork 炸 弹 的 细节 以 及 更 详细 的 解释 。 

可 以 通过 修改 配置 文件 /etc/security/limits.conf 来 限制 可 生成 的 最 大 进程 
数 来 避 开 这 枚 炸弹 。 


函数 也 能 像 环境 变 量 一 样 用 export 导 出 ,如 此 一 来 ,函数 的 作用 域 就 可 以 扩展 到 子 进程 中 ， 
例如 : 








export -f fname 
3. 读 取 命 令 返 回 值 (状态 ) 
我 们 可 以 按照 下 面 的 方式 获取 命令 或 函数 的 返回 值 : 


cmd; 
echo $?; 
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$? 会 给 出 命令 cmd 的 返回 值 。 


返回 值 被 称 为 退出 状态 。 它 可 用 于 分 析 命 令 执 行 成 功 与 否 。 如 果 命 令 成 功 退 出 , 那么 退出 状 
态 为 0， 和 否则 为 非 0。 


我 们 可 以 按照 下 面 的 方法 检测 某 个 命令 是 否 成 功 结束 : 





#!/bin/bash 
# 文 件 名 : success_test.sh 
CMD="command" #command 指 代 你 要 检测 退出 状态 的 目标 命令 


SCMD 
if [ $? -eq 0 ]; 
then 
echo "SCMD executed successfully" 
else 


echo "SCMD terminated unsuccessfully" 
fi 


4. 向 命令 传递 参数 


命令 的 参数 能 够 以 不 同 的 格式 进行 传递 。 假 设 -p、-v 是 可 用 选项 ，-k N 是 男 一 个 可 以 接受 
数字 的 选项 ， 同 时 该 命令 还 接受 一 个 文件 名 作为 参数 ,那么 ， 它 有 如 下 几 种 执行 方式 : 





Ds command -p -v -k 1 file 
Ds command -pv -k 1 file 
Ds command -vpk 1 file 





Ds command file -pvk 1 


1.13 ”将 命令 序列 的 输出 读 入 变量 

shell 脚 本 最 棒 的 特性 之 一 就 是 可 以 轻松 地 将 多 个 命令 或 工具 组 合 起 来 生成 输出 。 一 个 命令 的 
输出 可 以 作为 另 一 个 命令 的 输入 ， 而 这 个 命令 的 输出 又 会 传递 至 另 一 个 命令 ， 依 次 类 推 。 这 种 命 
令 组 合 的 输出 可 以 被 存储 在 一 个 变量 中 。 这 则 攻略 将 演示 如 何 组 合 多 个 命令 以 及 如 何 读 取 其 输出 。 








1.13.1 ”预备 知识 


输入 通常 是 通过 stdin 或 参数 传递 给 命令 。 输 出 要 么 出 现在 stdaerr， 要 么 出 现在 stdout。 
当 我 们 组 合 多 个 命令 时 ， 通常 将 stain 用 于 输入 ，stqout 用 于 输出 。 























此 时 ,这 些 命 令 被 称 为 过 滤器 ( fiter )。 我 们 使 用 管道 (pipe ) 连接 每 个 过 滤器 。 管 道 操 作 符 
是 | 9 例如 : 


$ cmdl | cmd2 | cmd3 
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这 里 我 们 组 合 了 3 个 命令 。cma1 的 输出 传递 给 cmda2 ， 而 cmqa2 的 输出 传递 给 cmda3 ， 最 终 的 输 
出 (来 自 cmd3 ) 将 会 被 打印 或 导入 某 个 文件 。 
1.13.2 ”实战 演练 
我 们 通常 使 用 管道 并 利用 子 shell 的 方式 将 多 个 文件 的 输出 组 合 起 来 。 方 法 如 下 所 示 。 
(1) 先 从 组 合 两 个 命令 开始 : 




















$ 1s | cat -n > out.txt 


1s 的 输出 〈 当前 目录 内 容 的 列表 ) 被 传 给 cat -n， 后 者 将 通过 stdin 所 接收 到 输入 
内 容 加 上 行 号 ， 然 后 将 输出 重 定向 到 文件 out .txt。 


(2) 我 们 可 以 用 下 面 的 方法 读 取 由 管道 相连 的 命令 序列 的 输出 : 




















cmd_output=$ (COMMANDS) 
这 种 方法 被 称 为 子 shell。 例 如 : 


cmd output=$(ls | cat -n) 
echo S$cmd output 


男 一 种 被 称 为 反 引 用 ( 有些 人 们 也 称 它 为 反 标 记 ) 的 方法 也 可 以 用 于 存储 命令 输出 : 





cmd _ output= COMMRANDS 
例如 : 


cmd output=“1ls | cat -n. 
echo $cmd output 


反 引 用 与 单 引号 可 不 是 一 回 事 ， 它 位 于 键盘 的 ~ 键 上 。 























1.13.3 ”补充 内 容 
有 很 多 种 方法 可 以 给 命令 分 组 。 来 看 看 其 中 的 几 种 。 
1. 利用 子 shell 生 成 一 个 独立 的 进程 
子 shell 本 身 就 是 独立 的 进程 。 可 以 使 用 () 操 作 符 来 定义 一 个 子 shell: 








pwd; 

(cd /bin; 1s); 

pwd; 

当 命 令 在 子 shell 中 执行 时 , 不 会 对 当前 shell 有 任何 影响 ; 所 有 的 改变 仅 限于 子 shell 内 。 例如 ， 
当 用 cg 命令 改变 子 shell 的 当前 目录 时 ， 这 种 变化 不 会 反映 到 主 shell 环 境 中 。 
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pwd 命 令 打 印 出 工作 目录 的 路 径 。 
cq 命令 将 当前 目录 更 改 为 给 定 的 目录 路 径 。 
2. 通过 引用 子 shell 的 方式 保留 空格 和 换行 符 


假设 我 们 使 用 子 shell 或 反 引 用 的 方法 将 命令 的 输出 读 入 一 个 变量 中 ， 可 以 将 它 放 入 双 引 号 
中 ， 以 保留 空格 和 换行 符 (\n )。 例如: 





$ cat text.txt 
1 
2 
3 


Am 


out=$ (cat 七 ext .txt) 
echo S$out 


Pu 


2 3 # Lost \n spacing in 1,2,3 


out="$ (cat tex.txt)" 
echos$out 


WO PU 


1.14 不 使 用 回 车 键 来 读 取 nn 个 字符 


read 是 一 个 重要 的 Bash 命 令 ， 它 用 于 从 键盘 或 标准 输入 中 读 取 文本 。 我 们 可 以 使 用 read 以 
交互 的 形式 读 取 来 自用 户 的 输入 ， 不 过 reaq 能 做 的 可 远 不 止 这 些 。 任 何 编程 语言 的 输入 库 大 多 
都 是 从 键盘 读 取 输 入 ; 但 只 有 当 回 车 键 按 下 的 时 候 , 才 标志 着 输入 完毕 。 在 有 些 重要 情形 下 是 没 
法 按 回 车 键 的 , 输入 结束 与 否 是 基于 字符 数 或 蘑 个 特定 字符 来 决定 的 。 例如， 在 一 个 游戏 中 ， 当 
按 下 + 键 时 ， 小 球 就 会 向 上 移动 。 那 么 若 每 次 都 要 按 下 + 键 ， 然 后 再 按 回 车 键 来 确认 已 经 按 过 + 
键 ， 这 就 显然 太 低 效 了 。zreaq 命 令 提 供 了 一 种 不 需要 按 回 车 键 就 能 够 搞定 这 个 任务 的 方法 。 












































实战 演练 
你 可 以 借助 read 命 令 的 各 种 选项 来 实现 不 同 的 效果 。 方 法 如 下 所 示 。 
(1) 下 面 的 语句 从 输入 中 读 取 n 个 字符 并 存 人 变量 variable_name: 
read -n number of chars variable name 
例如 : 


$ read -n 2 var 
$ echo $var 


34 


第 1 章 小 试 牛刀 





1.15 


在 
被 下 载 


1.15.1 


(2) 用 无 回 显 的 方式 读 取 密码 : 
read -s var 
(3) 显示 提示 信息 : 
read -p "Enter input:" var 
(4) 在 特定 时 限 内 读 取 输入 : 
read -t timeout var 
例如 : 


$ read -t 2 var 


# 在 2 秒 内 将 键入 的 字符 囊 读 入 变量 Var 
(5) 用 特定 的 定 界 符 作 为 输入 行 的 结 

read -d delim char var 

例如 : 


$ read -d ":" var 
hello:#var 被 设置 为 hello 


运行 命令 直至 执行 成 功 
日 常 工作 中 使 用 shell 时 ,有 时 候 命令 只 有 满足 某 些 条 件 或 是 某 种 外 部 事件 ( 例如 文件 可 以 
) 操作 才能 够 成 功 执行 。 这 种 情况 下 ， 你 可 能 希望 重复 执行 命令 ， 直 到 成 功 为 止 。 





实战 演练 


按照 以 下 方式 定义 函数 : 


repeat () 


{ 


while true 


} 
或 者 把 














do 
SG@ && return 
done 





它 放 入 shell 的 rc 文件 ， 更 便于 使 用 : 


repeat() { while true; do $Q@ && return; done } 





1.15.2 ”工作 原理 
我 们 创建 了 函数 repeat， 它 包含 了 一 个 无 限 while 循 环 ， 该 循环 执行 以 参数 形式 ( 通过 $@ 
访问 ) 传人 函数 的 命令 。 如 果 命 令 执行 成 功 ， 则 返回 ， 进 而 退出 循环 。 
1.15.3 ”补充 内 容 
我 们 已 经 看 过 了 用 于 重复 执行 命令 , 直到 其 执行 成 功 的 基本 做 法 。 接 着 来 看 看 更 高 效 的 方式 。 
1. 一 种 更 快 的 做 法 


在 大 多 数 现代 系统 中 ，true 是 作为 /bin 中 的 一 个 二 进 制 文件 来 实现 的 。 这 就 意味 着 每 执行 一 
次 while 循 环 ，shell 就 不 得 不 生成 一 个 进程 。 如 果 不 想 这 样 ， 可 以 使 用 shell 内 建 的 “:” 命 令 ， 
它 总 是 会 返回 为 0 的 退出 码 : 











repeat() { while :; do S$@ && return; done } 
尽管 可 读 性 不 高 ， 但 是 肯定 比 第 一 种 方法 快 。 
2. 增加 延 时 


假设 你 要 用 repeat () 从 Internet 上 下 载 一 个 暂时 不 可 用 的 文件 ， 不 过 这 个 文件 只 需要 等 一 会 
就 能 下 载 。 方 法 如 下 : 








repeat wget -c http://www.example.com/software-0.1.tar.gz 

如 果 采 用 这 种 形式 ， 需 要 向 www.example.com 发 送 很 多 数据 ， 有 可 能 会 对 服务 器 产生 影响 。 
( 甚至 也 会 给 你 造成 麻烦 ,如果 服 务 器 认为 你 是 在 发 送 垃圾 信息 ,就 可 能 把 你 列 入 黑 名 单 。) 要 解 
决 这 个 问题 ， 我 们 可 以 修改 函数 ， 加 入 一 段 短 暂 的 延 时 : 

repeat() { while :; do S$@ && return; Sleep 30; done } 


这 使 得 命令 每 30 秒 运行 一 次 。 





1.16 ”字段 分 隔 符 和 过 代 器 

内 部 字段 分 隔 符 ( Internal Field Separator，IFS ) 是 shell 脚 本 编程 中 的 一 个 重要 概念 。 在 处 理 
文本 数据 时 ， 它 的 用 途 可 不 小 。 我 们 将 会 讨论 把 单个 数据 流 划 分 成 不 同 数据 元 素 的 定 界 符 
( delimiter )。 内 部 字段 分 隔 符 是 用 于 特定 用 途 的 定 界 符 。IFS 是 存储 定 界 符 的 环境 变量 。 它 是 当前 
shell 环 境 使 用 的 默认 定 界 字符 串 。 


考虑 一 种 情形 : 我 们 需要 迭代 一 个 字符 串 或 逗号 分 隔 型 数值 (Comma Separated Value，CSV ) 中 
的 单词 。 如 果 是 前 一 种 , 则 使 用 IFs=" . "; 如 果 是 后 一 种 , 则 使 用 IFs="，"。 接 下 来 看 看 具体 的 做 法 。 
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1.16.1 预备 知识 


考虑 CSV 数 据 的 情况 : 
data="name, sex,rollno,1location" 
我 们 可 以 使 用 IFS 读 取 变 量 中 的 每 一 个 


OldIFS=$IFS 


IFS=, now, 
for item in S$data; 
do 


echo Item: S$item 
done 


IFS=$oldIFS 
输出 如 下 : 


Item: name 
Item: sex 
Item: rollno 
Item: location 


IFS 的 默认 值 为 空白 字符 ( 换行 符 、 制 





条 目 。 


表 符 或 者 空格 )。 








当 IFS 被 设置 为 辟 号 时 ，shell 将 逗号 视 为 一 个 定 界 符 ， 因 此 变量 $item 在 每 次 迭代 中 读 取 由 


号 分 隔 的 子 串 作 为 变量 值 。 


如 号 


如 果 没 有 把 正 S 设 置 成 逗号 ， 那么 上 面 


1.16.2 ”实战 演练 


让 我 们 以 /etc/passwd 为 例 ， 看 看 IFS 的 男 一 种 用 法 。 在 文件 /etc/passwd 中 ， 每 一 行 包含 了 由 冒 
号 分 隔 的 多 个 条 目 。 文 件 中 的 每 行 都 对 应 一 位 用 户 的 相关 属性 。 


考虑 这 样 的 输入 : root:x:0:0:root:/root:/bin/bash。 每 行 的 最 后 一 项 指定 了 用 户 的 


日 
nn 





默认 shell。 可 以 按照 下 面 的 方法 巧妙 地 利 月 





的 脚本 会 将 全 部 数据 作为 单个 字符 串 打 印 出 来 。 














HIFS 打 印 出 用 户 以 及 他 们 默认 的 shell: 





#!/bin/bash 

# 用 途 : 演示 IFS 的 用 法 
line="root:x:0:0:root:/root:/bin/b 
oldIFS=$IFS; 

LS 

count=0 

for item in S$line; 

do 


ash" 
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[ Scount -eq 0 ] && user=$item; 
[ Scount -eq 6 ] && shell=$item; 
let count++ 





done; 
IFS=$oldIFS 
echo $user\'s shell is $shell; 


输出 为 : 

root's shell is /bin/bash 

对 一 系列 值 进 行 迭代 时 ,循环 非常 有 用 。Bash 提 供 了 多 种 类 型 的 循环 。 下 面 就 来 看 看 怎么 样 
使 用 它们 。 


口 Eor 循 环 


for var in list; 
do 

commands; # 使 用 变量 $var 
done 


list 可 以 是 一 个 字符 串 ， 也 可 以 是 一 个 序列 。 
我 们 可 以 轻松 地 生成 不 同 的 序列 。 


echo {1. .50} 能 够 生成 一 个 从 1~50 的 数字 列表 。echo {a..z} 或 {A. .2Z} 或 {a..h} 可 以 生 
成 字母 列表 。 同 样 ， 我 们 可 以 将 这 些 方法 结合 起 来 对 数据 进行 拼接 ( concatenate )。 下 面 的 
代码 中 ， 变 量 i 在 每 次 迭代 的 过 程 里 都 会 保存 一 个 字符 ， 范 围 从 a~z: 











for i in {a..2z}; do actions; done; 
for 循 环 也 可 以 采用 C 语 言 中 for 循 环 的 格式 。 例 如 : 


for((i=0;i<10;i++)) 
{ 

commands; # 使 用 变量 $i 
} 


口 while 循 环 
while condition 
do 


commands; 
done 


用 true 作 为 循环 条 件 能 够 产生 无 限 循 环 。 
口 until1 循 环 


在 Bash 中 还 可 以 使 用 一 个 特殊 的 循环 until。 它 会 一 直 执行 循环 ， 直 到 给 定 的 条 件 为 真 。 
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例如 : 


Xs 
until [ $x -eq 9 ]; # 条 件 是 [Sx -eq 9 ] 
do 
let x++; echo S$x; 
done 


1.17 ”比较 与 测试 

程序 中 的 流程 控制 是 由 比较 语句 和 测试 语句 处 理 的 。Bash 同 样 具 备 多 种 与 Unix 系 统 级 特性 相 
兼容 的 执行 测试 的 方法 。 我 们 可 以 用 if 、if else 以 及 逻辑 运算 符 进 行 测试 ， 用 比较 运算 符 来 比 
较 数 据 项 。 除 此 之 外 ， 还 有 一 个 test 命 令 也 可 以 用 于 测试 。 这 些 命令 的 用 法 如 下 。 


























实战 演练 
来 看 看 用 于 比较 和 测试 的 各 种 方法 : 


口 if 条 件 





iE Conditiorn; 
then 

commands; 
Ea 


Delse if 和 和 else 


iE Gonditiorsy 

then 
commands; 

else if condition; then 
commands; 

else 
commands; 

下 让 


if 和 else 语 句 可 以 进行 说 套 。if 的 条 件 判 断 部 分 可 能 会 变 得 很 长 ， 
但 可 以 用 逻辑 运算 符 将 它 变 得 简洁 一 些 : 
口 [ condition ] && action; # 如 果 condition 为 真 , 则 执行 action; 
Cs 


口 [ condition] || action; # 如 果 condition 为 假 , 则 执行 action。 





&& 有 是 逻辑 与 运算 符 ，| | 是 逻辑 或 运算 符 。 编 写 Bash 脚 本 时 ， 这 是 一 
个 很 有 用 的 技巧 。 现 在 来 了 解 一 下 条 件 和 比较 操作 。 
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口 算术 比较 
条 件 通常 被 放置 在 封闭 的 中 括号 内 。 一 定 要 注意 在 [或 ] 与 操作 数 之 间 有 一 个 空格 。 如 果 
忘记 了 这 个 空格 ， 脚 本 就 会 报错 。 例 如 : 
[$var -eq 0 ] or [ S$var -eq 0] 
对 变量 或 值 进行 算术 条 件 判 断 : 


[ Svar -eq 0 ] # 当 $var 等 于 0 时 ， 返 回 真 
[ Svar -ne 0 ] # 当 Svar 为 非 0 时 ， 返 回 真 


其 他 重要 的 操作 符 如 下 所 示 。 

加 -gt; 大 下 5 

-1t: 小于。 

四 一 Se : 大 于 或 等 于 。 

-le: 小 于 或 等 于 。 

可 以 按照 下 面 的 方法 结合 多 个 条 件 进行 测试 : 


[ Svarl -ne 0 -a S$Svar2 -gt 2 ] # 使 用 逻辑 与 -a 
[ $varl -ne 0 -o var2 -gt 2 ] # 远 辑 或 -o 


口 文件 系统 相关 测试 









































我 们 可 以 使 用 不 同 的 条 件 标志 测试 不 同 的 文件 系统 相关 的 属性 。 

@[ -f $file_var ]: 如 果 给 定 的 变量 包含 正常 的 文件 路 径 或 文件 名 ， 则 返回 真 。 
m [ -x $var ]: 如 果 给 定 的 变量 包含 的 文件 可 执行 ， 则 返回 真 。 

[ -d $var ] : 如 果 给 定 的 变量 包含 的 是 目录 ， 则 返回 真 。 

m [ -e $var ]: 如 果 给 定 的 变量 包含 的 文件 存在 ， 则 返回 真 。 

am [ -c $var ]: 如 果 给 定 的 变量 包含 的 是 一 个 字符 设备 文件 的 路 径 ， 则 返回 真 。 
nm [ -b $var ]: 如 果 给 定 的 变量 包含 的 是 一 个 块 设备 文件 的 路 径 ， 则 返回 真 。 
nm [ -w $var ]: 如 果 给 定 的 变量 包含 的 文件 可 写 ， 则 返回 真 。 

m [ -r $var ]: 如 果 给 定 的 变量 包含 的 文件 可 读 ， 则 返回 真 。 

m [ -L $var ]: 如 果 给 定 的 变量 包含 的 是 一 个 符号 链接 ， 则 返回 真 。 

使 用 方法 如 下 : 

fpath="/etc/passwd" 

If [ -e $fpath ]; then 


echo File exists; 
else 

echo Does not exist; 
£1i 


40 


后 


第 1 章 小 试 牛刀 





口 字符 串 比较 





使 用 


好 避 开 它们 。 
月 下 面 的 方法 检查 两 个 字符 串 ， 看 看 它们 是 否 相 同 。 


可 以 月 





[ Sstr1L = $str2 ]] 








的 文本 是 一 模 一 样 的 。 


ml[[ 


SSstr1 == $str2 ]]: 


字符 串 比 较 时 ， 最 好 用 双 中 括号 ， 因 为 有 





: 当 str1 等 于 str2 时 ， 








时 候 采 用 单个 中 括号 











也 可 以 检查 两 个 字符 串 是 否 不 同 。 


ml[[ 


Sstr1 l= Sstr2 ]] 














我 们 还 可 以 检查 字符 串 的 字母 序 情 况 ， 具 体 如 下 所 示 。 


: 如 果 str1 的 字母 序 比 str2 大 ， 则 返回 
: 如 果 str1 的 字母 序 比 str2 小 ， 
包含 的 是 空 字符 串 ， 


本 加 国 国 
一 一 一 一 
一 一 一 一 


| 受 三 


Sstrl > $str2 
sstrl < $str2 


-Z Sstrl1 ] 





-n Sstrl1 ] 


]: ee 
] : 如 果 str1 


在 = 前 后 








包含 的 是 非 空 字 


关系 了 了 ， 而 变 成 了 赋值 语句 。 


符 串 ， 则 返 


后 各 有 一 个 空格 。 如 果 忘 记 加 空 


则 返回 
真 


一 oO 





格 ， 


使 用 逻辑 运算 符 gg 和 | | 能 够 很 容易 地 将 多 个 条 件 组 合 起 来 : 


[[ =z $str2 ]] ; 


[[ =z $str2 ]]; 


echo strl is nonempty and str2 is empty string. 


Ei | OE eh os 7 Wl WN 3 
then 
commands; 
下 让 
例如 : 
strl="Not empty " 
St 
ES og 7 = 06 2 Wl WN 3 
then 
下 让 
偷 出 如 下 : 


strl is nonempty and str2 is empty string. 


: 如 果 str1l 和 str2 不 相同 ， 则 返回 真 


回 3 


返回 真 。 也 就 是 说 ， 


喇 如 


O 





会 产生 错误 ， 所 以 最 


守 串 是 否 相 等 的 男 一 种 写法 。 


这 是 检查 字符 


[e) 


str1 和 str2 包 含 


那 就 不 是 比 
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test 命 令 可 以 用 来 执行 条 件 检 测 。 用 test 可 以 避免 使 用 过 多 的 括号 。 之 前 讲 过 的 口中 的 测 Ce 
试 条 件 同 样 可 以 用 于 test 命 令 。 


例如 : 





if [ $var -eq 0 ]; then echo "True"; fi 
也 可 以 写成 : 


if test S$var -eq 0 ; then echo "True"; fi 














命令 之 乐 
本 章 内 容 
口 用 cat 进 行 拼接 口 临时 文件 命名 与 随机 数 
口 录制 与 回放 终端 会 话 口 分 割 文件 和 数据 
口 文件 查找 与 文件 列表 口 根据 扩展 名 切 分 文件 各 
口 玩 转 xargs 口 用 rename 和 mv 批量 重 命 名 文件 
口 用 tr 进行 转换 口 拼写 检查 与 词典 操作 
口 校 验 和 与 核实 口 交互 输入 自动 化 
口 加 密 工 具 与 散 列 口 利用 并 行进 程 加 速 命令 执行 
口 排序 、 单 一 与 重复 


2.1 简介 


类 Unix 系 统 享有 最 棒 的 命令 行 工具 。 它 们 帮助 我 们 完成 各 类 任务 , 使 我 们 的 工作 变 得 更 轻松 。 
这 些 命令 各 有 侧重 , 在 实践 中 你 可 以 通过 结合 多 个 命令 来 解决 复杂 的 问题 。 一 些 经 常用 到 的 
是 





尽 
命 




















A 
二 
今 是 grep、awk、sed 和 find。 





掌握 Unix/Linux 命 令 行 可 谓 是 一 门 艺术 。 实 践 得 越 多 ， 收 益 就 越 大 。 本 章 将 为 你 介绍 一 些 最 
有 趣 同 时 也 是 最 实用 的 命令 。 


2.2 用 cat 进行 拼接 


cat 是 命令 行 玩 家 首先 必须 学 习 的 命令 之 一 。 它 通常 用 于 读 取 、 显 示 或 拼接 文件 内 容 ， 不 过 
cat 的 能 力 远 不 止 如 此 。 用 一 行 命令 将 来 自 标准 输入 以 及 文件 的 数据 给 组 合 起 来 ， 这 可 是 个 让 人 
挠 头 的 难题 。 通 常 的 做 法 是 将 stdin 重 定向 到 一 个 文件 ， 然 后 再 将 两 个 文件 组 合 到 一 起 。 不 过 我 
们 可 以 使 用 cat 命 令 一 次 性 搞定 。 接 下 来 你 会 看 到 cat 的 基本 用 法 和 高 级 用 法 。 






































2.2 用 cat 进行 拼接 
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2.2.1 实战 演练 
cat 命 令 是 一 个 平日 里 经 常会 使 用 到 的 简单 命令 。 它 本 身 表 示 concatenate ( 拼接 )。 
用 cat 读 取 文件 内 容 的 一 般 写 法 是 : 
$ cat filel file2 file3 ... 
这 个 命令 将 作为 命令 行 参数 的 文件 内 容 拼 接 在 一 起 。 
口 打印 单个 文件 的 内 容 : 
$ cat file.txt 


This is a line inside file.txt 
This is the second line inside file.txt 


口 打印 多 个 文件 的 内 容 : 








$ cat one.txt two.txt 
This is line from one.txt 
This is line from two.txt 


2.2.2 工作 原理 
cat 的 用 法 多 种 多 样 。 让 我 们 来 看 看 其 中 的 一 些 。 
cat 命 令 不 仅 可 以 读 取 文件 、 拼 接 数 据 ， 还 能 够 从 标准 输入 中 进行 读 取 。 
从 标准 输入 中 读 取 需要 使 用 管道 操作 符 : 


OUTPUT FROM SOME COMMANDS | cat 


类 似 地 ， 我 们 可 以 用 cat 将 来 自 输入 文件 的 内 容 与 标准 输入 拼接 在 一 起 ,将 stain 和 男 一 个 


文件 中 的 数据 结合 起 来 。 方 法 如 下 : 
$ echo 'Text through stdin' | cat - file.txt 


在 上 面 的 代码 中 ，- 被 作为 stain 文 本 的 文件 名 。 
2.2.3 补充 内 容 

cat 命 令 还 有 一 些 用 于 文件 查看 的 选项 。 来 看 看 它们 的 用 法 。 

1. 摆脱 多 余 的 空白 行 


有 时候 文 本 文件 中 可 能 包含 多 处 连续 的 空 日 行 。 如 果 你 需要 删除 这 些 额 外 的 空白 行 ， 


面 的 方法 : 


使 用 下 
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$ cat -s file 
例如 : 


$ cat multi blanks.txt 
line 1 


line2 


line3 


line4 


$ cat -s multi_ blanks.txt # 压 缩 相 邻 的 空白 行 
line 1 


line2 

line3 

line4 

男 外， 也 可 以 用 tr 删除 所 有 的 z 空 白 行 ,我们 会 在 2.6 节 详细 讨论 。 
2. 将 制 表 符 显示 为 ^| 


单 从 视觉 上 很 难 将 制 表 符 同 连续 的 空格 区 分 开 。 而 在 用 Python 编写 程序 时 ,用 于 代码 缩 进 的 
制 表 符 以 及 空格 是 具有 特殊 含义 的 。 因 此 ,者 在 应 该 使 用 空格 的 地 方 误 用 了 制 表 符 的 话 ， 就 会 产 
生 缩 进 错误 。 仅 仅 在 文本 编辑 器 中 进行 观察 是 很 难 发 现 这 种 错误 的 。cat 有 一 个 特性 ， 可 以 将 制 
表 符 着 重 标记 出 来 。 该 特性 对 排除 缩 进 错 误 非 常 有 用 。 用 cat 命 令 的 -T 选 项 能 够 将 制 表 符 标记 成 
^|。 例 如 : 











$ cat file.py 
def Eunction() : 
var = 5 
Dext = 6 
third = 7 


$ cat -T file.py 
def Eunction() : 
^Ivar = 5 

next = 6 
AIthird = 74^I 
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3. 行 号 
使 用 cat 命 令 的 -n 选 项 会 在 输出 的 每 一 行内 容 之 前 加 上 行 号 。 别 担心 ，cat 命 令 绝 不 会 修改 
你 的 文件 ， 它 只 是 根据 用 户 提 供 的 选项 在 stdqout 中 生成 一 个 修改 过 的 输出 而 已 。 例 如 : 








$ cat lines.txt 
line 
line 
line 


$ cat -n lines.txt 


1 line 
2 line 
3 line 
| 全 shot Rat, Wm | 


2.3 录制 并 回放 终端 会 话 


当 你 需要 为 别人 在 终端 上 演示 某 些 操作 或 是 需要 准备 一 个 命令 行 教程 时 , 通常 得 一 边 手动 输 
入 命令 一 边 演示 , 或 者 也 可 以 录制 一 段 屏 幕 演示 视频 ,然后 再 回放 出 来 。 其实 也 有 其 他 的 实现 方 
法 。 利 用 script 和 scriptreplay 命 令 ， 我们 可 以 录制 命令 的 次 序 以 及 时 序 ， 将 相关 数据 记录 
在 文本 文件 中 。 利 用 这 些 文件 ， 其 他 人 可 以 在 终端 上 回放 并 查看 命令 的 输出 。 











2.3.1 预备 知识 


script 和 scirptreplay 命 令 在 绝 大 多 数 GNU/Linux 发 行 版 上 都 可 以 找到 。 把 终端 会 话 记 录 
到 一 个 文件 中 挺 好 玩 的 。 你 可 以 通过 录制 终端 会 话 来 制作 命令 行 教 学 视频 教程 , 也 可 以 与 他 人 分 
享 会 话 记录 文件 ， 共 同 研究 如 何 使 用 命令 行 完成 某 项 任务 。 














2.3.2 ”实战 演练 
开始 录制 终端 会 话 : 


$ script -t 2> timing.log -a output.session 
type commands; 


exit 
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注意 ， 对 于 不 支持 单独 将 stderr 重 定向 到 文件 的 shell ( 比如 csh shell )， 这 
类 >- 则 攻略 是 没 法 使 用 的 。 





两 个 配置 文件 被 当做 script 命 令 的 参数 。 其 中 一 个 文件 (timing.log ) 用 于 存储 时 序 信息 ， 
描述 每 一 个 命令 在 何 时 运行 ， 另 一 个 文件 ( output.session ) 用 于 存储 命令 输出 。-t 选 项 用 于 将 时 
序数 据 导入 stderr。2> 则 用 于 将 staerr 重 定向 到 timing.log。 

利用 这 两 个 文件 : timing.log ( 存储 时 序 信 息 ) 和 output.session( 存储 命令 输出 信息 )， 我 们 
可 以 按照 下 面 的 方法 回放 命令 执行 过 程 : 


$ scriptreplay timing.log output .session 


# 按 播放 命令 序列 输出 


2.3.3 工作 原理 


通常 , 我们 会 录制 桌面 环境 视频 来 作为 教程 使 用 。 但 是 视频 需要 大 量 的 存储 空间 ,而 终端 肢 
本 文件 仅仅 是 一 个 文本 文件 ， 其 文件 大 小 不 过 是 KB 级 别 。 

你 可 以 把 timing.log 和 output.session 文 件 分 享 给 任何 想 在 自己 的 终端 FE 回放 这 段 终端 会 话 
的 人 。 








2.4 文件 查找 与 文件 列表 


find 是 Unix/Linux 命 令 行 工 具 箱 中 最 棒 的 工具 之 一 。 该 命令 对 于 编写 shell 脚 本 所 起 到 的 功用 
不 可 小 视 , 但 是 多 数 人 却 无 法 最 大 程度 发 挥 它 的 功效 。 这 则 攻略 讨论 了 find 的 大 多 数 常 见 用 法 。 





2.4.1 预备 知识 


findq 命 令 的 工作 方式 如 下 : 沿 着 文件 层次 结构 向 下 遍历 ， 匹 配 符合 条 件 的 文件 ， 执 行 相应 
的 操作 。 下 面 来 看 看 finq 命 令 的 各 种 应 用 场景 和 基本 用 法 。 





2.4.2 ”实战 演练 
要 列 出 当前 目录 及 子 目录 下 所 有 的 文件 和 文件 夹 ， 可 以 采用 下 面 的 写法 : 
$ find base path 


bash_path 可 以 放 在 任意 位 置 (例如 /home/slynux )，find 会 从 该 位 置 开始 向 下 查找 。 
例如 : 
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$ find 。 -print 
# 打印 文件 和 目录 的 列表 


. 指定 当前 目录 ，. . 指定 父 目 录 。 这 是 Unix 文 件 系统 中 的 约定 用 法 。 

-pzint 指 明 打 印 出 匹配 文件 的 文件 名 〈 路 径 )。 当 使 用 -print 时 ，' \n' 作 为 用 于 对 输出 的 
文件 名 进行 分 隔 。 就 算 你 忽略 -print，find 命 令 仍 会 打印 出 文件 名 。 

-print0 指 明 使 用 '\0' 作 为 匹配 的 文件 名 之 间 的 定 界 符 。 当 文件 名 中 包含 换行 符 时 , 这 个 方 
法 就 有 用 武之 地 了 。 




















2.4.3 ”补充 内 容 


至 此 ,我 们 已 经 学 习 了 find 命 令 最 常见 的 用 法 。 作 为 一 款 强大 的 命令 行 工具 ，f£ing 命 令 包 
含 了 诸多 值得 一 提 的 选项 。 接 下 来 看 看 fina 命 令 的 其 他 功能 。 


1. 根据 文件 名 或 正则 表达 式 进 行 搜索 


选项 -name 的 参数 指定 了 文件 名 所 必须 匹配 的 字符 串 。 我 们 可 以 将 通配符 作为 参数 使 用 。 
* .上 txt 能够 匹配 所 有 以 .txt 结 尾 的 文件 名 。 选 项 -print 在 终端 中 打印 出 符合 条 件 〈 例如 -name ) 
的 文件 名 或 文件 路 径 ， 这 些 匹配 条 件 通过 finqa 命 令 的 选项 给 出 。 





$ find /home/slynux -name "*.txt" -print 


find 命 令 有 一 个 选项 -iname ( 忽略 字母 大 小 写 )， 该 选项 的 作用 和 -name 类 似 ， 只 不 过 在 
匹配 名 字 时 会 忽略 大 小 写 。 


例如 : 
$ 1s 


example.txt EXAMPLE.txt file.txt 
$ find . -iname "example*" -print 





./example.txt 

» /EXAMPLE .txt 

如 果 想 匹配 多 个 条 件 中 的 一 个 ， 可 以 采用 OR 条 件 操 作 : 
$ 1s 


new.txt some.jpg text .pdf 

$ find . \( -name "*.txt" -OO -name "*.pdf" \) -print 
./text .pdf 

./new.txt 


上 面 的 代码 会 打印 出 所 有 的 .txt 和 .pdf 文件 ， 是 因为 这 个 find 命 令 能 够 匹配 所 有 这 两 类 文件 。 
\( 以 及 \) 用 于 将 -name "*.txt"” -o -name "*.pdf" 视 为 一 个 整体 。 

















选项 - ee -name 总 是 用 给 定 的 文件 名 进行 匹配 。 
-patn 则 将 文件 路 径 作为 一 个 整体 进行 匹配 。 例 如 : 
$ find /home/users -path "*/slynux/*" -print 


这 会 匹配 以 下 路 径 : 











/home/users/list/slynux.txt 
/home/users/slynux/eg.css 


逐 和 选项 -regex 的 参数 和 -path 的 类 似 ， 只 不 过 -regex 是 基于 正则 表达 式 来 匹 
配 文件 路 径 的 。 





en i tl 它 可 以 8 我 们 借助 这 种 模式 来 匹配 文本 
行 打印 。 使 用 正则 表达 式 进 行文 本 匹配 的 一 个 典型 例子 就 是 从 一 堆 文 本 中 解析 出 所 有 的 
E- 0 E- i me 所 以 可 以 将 其 一 般 化 为 [a-z0-9]+ 
@[a-z0-9]+.[a-z0-9]+。 符号 + 指明 在 它 之 前 的 字符 类 中 的 字符 可 以 出 现 一 次 或 多 次 。 
下 面 的 命令 匹配 .py 或 .sh 文件 : 
$ 1s 
new.PY next.jpg test.py 


$ find 。 -regex ".*\(\.py\|\.sh\)s$" 
./test.py 


类 似 地 ，-iregex 可 以 让 正 则 表达 式 忽 略 大 小 写 。 例 如 : 
$ find . -iregex ".*\(\.py\|\.sh\)s$" 


./test.py 
./new.PpY 


| 县 我 们 会 在 第 4 章 学 习 到 更 多 有 关 正 则 表达 式 的 内 容 。 | 


2. 否定 参数 
find 也 可 以 用 “!” 否 定 参数 的 含义 。 例 如 : 




















$ find . ! -name "*.txt" -print 
上 面 的 find 命 令 能 够 匹配 所 有 不 以 .txt 结 尾 的 文件 名 。 下 面 就 是 这 个 命令 的 运行 结 
$ 1s 


list.txt new.PY new.txt next.jpg test.py 
$ find . ! -name "*.txt" -print 


./next .jpg 
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/test.py 
/new.PY 


3. 基于 目录 深度 的 搜索 


fingd 命 令 在 使 用 时 会 遍历 所 有 的 子 日 录 。 我 们 可 以 采用 深度 选项 -maxdepth 和 -mindepth 
来 限制 fing 命 令 遍历 的 目录 深度 。 区 = 


大 多 数 情 况 下 ， 我 们 只 需要 在 当前 目录 中 进行 搜索 ， 无 须 再 继续 向 下 查找 。 对 于 这 种 情况 ， 
我 们 使 用 深度 选项 来 限制 fina 命 令 向 下 查找 的 深度 。 如 果 只 多 许 fina 在 当前 目录 中 查找 ， 深 度 
可 以 设置 为 1， 当 需要 向 下 两 级 时 ， 深 度 可 以 设置 为 2; 其 他 情况 可 以 依次 类 推 。 

可 以 用 -maxzaepth 指 定 最 大 深度 。 与 此 相似 , 我 们 也 可 以 指定 一 个 最 小 的 深度 ,告诉 fina 
应 该 从 此 处 开始 向 下 查找 。 如 果 我 们 想 从 第 二 级 目录 开始 搜索 ， 那 么 就 使 用 -minaepth 设 置 最 
小 深度 。 使 用 下 列 命令 将 fina 命 令 向 下 的 最 大 深度 限制 为 1: 











$ find 。 -maxdepth 1 -name "Ex*" -print 


该 命令 列 出 当前 目录 下 的 所 有 文件 名 以 付 ] 头 的 文件 。 即 使 有 子 目录 ， 也 不 会 被 打印 或 遍历 。 与 
之 类 似 ，-maxdepth 2 最 多 向 下 遍历 两 级 子 目 录 。 


-mindepth 类 似 于 -maxdepth， 不 过 它 设 置 的 是 find 开 始 遍 历 的 最 小 深度 。 这 个 选项 可 以 
用 来 查找 并 打印 那些 距离 起 始 路 径 一 定 深度 的 所 有 文件 。 例如 , 打印 出 深度 距离 当前 目录 至 少 两 
个 子 目录 的 所 有 文件 : 

$ find . -mindepth 2 -name "Ex*" -print 


./dirl/dir2/filel 
./dir3/dir4/f£2 


即使 当前 目录 或 dir1 和 dir3 中 包含 有 文件 ， 它 们 也 不 会 被 打印 出 来 。 

















-maxdepth 和 -mindepth 应 该 作为 fijnd 的 第 三 个 参数 出 现 。 如 果 作 为 第 4 
个 或 之 后 的 参数 ， 就 可 能 会 影响 到 find 的 效 府 ， 因 为 它 不 得 不 进行 一 些 不 必要 
， ”的 检查 。 例如 ， 如果 -maxdepth 作 为 第 四 个 参数 ，-type 作 为 第 三 个 参数 , find 
\ 名 、、 首先 会 找 出 符合 -type 的 所 有 文件 ,然后 在 所 有 匹配 的 文件 中 再 找 出 符合 指定 深 
度 的 那些 。 但 是 如 果 反 过 来 ,目录 深度 作为 第 三 个 参数 , -type 作 为 第 四 个 参数 ， 
那么 find 就 能 够 在 找到 所 有 符合 指定 深度 的 文件 后 ， 再 检查 这 些 文件 的 类 型 ， 
这 才 是 最 有 效 的 搜索 之 道 。 


4. 根据 文件 类 型 搜索 


Unix 类 系统 将 一 切 都 视 为 文件 。 文 件 具 有 不 同 的 类 型 ,例如 普通 文件 、 目 录 、 字 符 设备 、 块 
设备 、 符 号 链接 、 硬 链接 、 套 接 字 以 及 FIFO 等 。 
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-type 可 以 对 文件 搜索 进行 过 滤 。 借 助 这 个 选项 , 我 们 可 以 为 fing 命 令 指明 特定 的 文件 匹配 





类 型 。 
只 列 出 所 有 的 目录 : 
$s find . -type d -print 




















将 文件 和 目录 分 别 列 出 可 不 是 个 容易 事 。 不 过 有 了 finq 就 好 办 了 。 例 如 ， 只 列 出 普通 文件 : 


$s find 。 -type 上 -print 
只 列 出 符号 链接 : 
$s find . -type 1 -print 


你 可 以 按照 表 2-1 列 出 的 内 容 用 type 参 数 来 匹配 所 需要 的 文件 类 型 。 














表 2-1 

文件 类 型 类 型 参数 
普通 文件 上 
符号 链接 1 
目录 d 
字符 设备 

块 设备 b 

套 接 字 s 
FIFO p 


5. 根据 文件 时 间 进 行 搜 索 
Unix/Linux 文 件 系 统 中 的 每 一 个 文件 都 有 三 种 时 间 戳 ， 如 下 所 示 。 


口 访问 时 间 〈 -atime ): 用 户 最 近 一 次 访问 文件 的 时 间 。 
口 修改 时 间 〈 -mtime ): 文件 内 容 最 后 一 次 被 修改 的 时 间 。 
口 变化 时 间 ( -ctime ): 文件 元 数据 〈 例 如 权限 或 所 有 权 ) 最 后 一 次 改变 的 时 间 。 


Rs 在 Unix 中 并 没有 所 谓 “ 创 建 时 间 ” 的 概念 。 | 


-atime、-mtime、-ctime 可 作为 find 的 时 间 选 项 。 它 们 可 以 用 整数 值 指定 ， 单 位 是 天 。 
这 些 整 数值 通常 还 带 有 - 或 + : - 表示 小 于 ，+ 表示 大 于 。 


口 打印 出 在 最 近 7 天 内 被 访问 过 的 所 有 文件 : 
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$ find . -type f -atime -7 -print 
口 打印 出 恰好 在 7 天 前 被 访问 过 的 所 有 文件 : 
$ find . -type f -atime 7 -print 


口 打印 出 访问 时 间 超 过 7 天 的 所 有 文件 : 加 





$ find . -type f -atime +7 -print 


类 似 地 ,我 们 可 以 根据 修改 时 间 ， 用 -mtime 进 行 搜索 ， 也 可 以 根据 变化 时 间 ， 用 -ctime 进 
行 搜索 。 























-atime、-mtime 以 及 -ctime 都 是 基于 时 间 的 参数 ， 其 计量 单位 是 “天 ”。 还 有 其 他 一 些 基 
于 时 间 的 参数 是 以 分 钟 作为 计量 单位 的 。 这 些 参数 包括 : 


口 -amin (访问 时 间 ); 
口 -mmin ( 修改 时 间 ); 
口 -cmin (变化 时 间 )。 


举例 如 下 。 
打印 出 访问 时 间 超 过 7 分 钟 的 所 有 文件 : 














$ find 。 -type f -amin +7 -print 











find 男 一 个 漂亮 的 特性 是 -newer 参 数 。 使 用 -newer ， 我 们 可 以 指定 一 个 用 于 比较 时 间 戳 
的 参考 文件 ， 然 后 找 出 比 参考 文件 更 新 的 (更 近 的 修改 时 间 ) 所 有 文件 。 


例如 ， 找 出 比 file.txt 修 改 时 间 更 近 的 所 有 文件 : 

$ find . -type 上 -newer file.txt -print 

findq 命 令 的 时 间 戳 处 理 选 项 对 编写 系统 备份 和 维护 脚本 很 有 帮助 。 
6. 基于 文件 大 小 的 搜索 

根据 文件 的 大 小 ， 可 以 这 样 搜索 : 





$ find 。 -type 上 -size +2k 
# 大 于 2KB 的 文件 


$ find . -type 上 -size -2k 
# 小 于 2KB 的 文件 


$ find . -type 上 -size 2k 
# 大 小 等 于 2KB 的 文件 
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除了 k 之 外 ， 还 可 以 用 其 他 文件 大 小 单元 。 


口 b 一 一 块 (5$12 字 节 )。 
Dc 字 节 。 

口 w 一 一 字 (2 字 节 )。 
口 k 一 一 1024 字 节 。 

口 M 一 一 1024K 字 节 。 

D G 一 一 1024M 字 节 。 








7. 删除 匹配 的 文件 

-delete 可 以 用 来 删除 fina 查 找到 的 匹配 文件 。 

删除 当前 目录 下 所 有 的 .swp 文 件 : 

$ find 。 -type f -name "*.swp" -delete 

8. 基于 文件 权限 和 所 有 权 的 匹配 

也 可 以 根据 文件 权限 进行 文件 匹配 。 列 出 具有 特定 权限 的 所 有 文件 : 


$ find . -type f -Perm 644 -print 
# 打印 出 权限 为 644 的 文件 


-perm 指 明 finq 应 该 只 匹配 具有 特定 权限 值 的 文件 。 文 件 权限 会 在 3.5 节 进行 讲解 。 


以 Apache Web 服 务 器 为 例 。Web 服 务 器 上 的 PHP 文 件 需要 具有 合适 的 执行 权限 。 我 们 可 以 用 
下 面 的 方法 找 出 那些 没有 设置 好 执行 权限 的 PHP 文 件 : 














$ find . -type f -name "*.php" ! -perm 644 -print 


也 可 以 根据 文件 的 所 有 权 进 行 搜索 。 用 选项 -user USER 就 能 够 找 出 由 某 个 特定 用 户 所 拥有 
的 文件 。 


参数 UsER 可 以 是 用 户 名 或 UID。 


例如 ， 打 印 出 用 户 slynux 拥 有 的 所 有 文件 : 














$ find . -type f£ -user slynux -print 

9. 利用 fina 执 行 命令 或 动作 

find 命 令 可 以 借助 选项 -exec 与 其 他 命名 进行 结合 。-exec 算 得 上 是 finq 最 强大 的 特性 之 一 。 
在 前 一 节 中 , 我们 用 -perm 找 出 了 所 有 权限 不 当 的 PHP 文 件 。 这 次 的 任务 也 差不多 ,我 们 需 


要 将 某 位 用 户 ( 比如 root ) 全 部 文件 的 所 有 权 更 改 成 男 一 位 用 户 ( 比如 Web 服 务 器 默认 的 Apache 
用 户 www-data )， 那 么 就 可 以 用 -user 找 出 root 拥 有 的 所 有 文件 ， 然 后 用 -exec 更 改 所 有 权 。 
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| 你 必须 以 root 用 户 的 身份 执行 find 命 令 才 能 够 进行 所 有 权 的 更 改 。 | 


示例 如 下 : 
# find . -type 上 -user root -exec chown slynux {} \; 


在 这 个 命令 中 ，{} 是 一 个 与 -exec 选 项 搭配 使 用 的 特殊 字符 串 。 对 于 每 一 个 匹配 的 文件 ， 
{} 会 被 蔡 换 成 相应 的 文件 名 。 例 如 ，fing 命 令 找 到 两 个 文件 test1l.txt 和 test2.txt， 其 所 有 者 均 为 
slynux, 那么 find 就 会 执行 : 








chown slynux {} 
它 会 被 解析 为 chown slynux test1.txt 和 chown slynux test2.txt。 
有 时 候 我 们 并 不 希望 对 每 个 文件 都 执行 一 次 命令 。 我 们 更 希望 使 用 文件 列表 


各、、 作为 命令 参数 ， 这 样 就 可 以 少 运行 几 次 命令 了 。 如 果 是 这 样 ， 可 以 在 exec 中 使 
用 + 来 代替 ;。 





另 一 个 例子 是 将 给 定 目 录 中 的 所 有 C 程 序 文件 拼接 起 来 写 人 单个 文件 all_c_files.txt。 我 们 可 以 
用 finaq 找 到 所 有 的 C 文 件 ， 然 后 结合 -exec 使 用 cat 命 令 : 


$ find 。 -type f -name "*.c" -exec cat {} \;>all c files.txt 


-exec 之 后 可 以 接任 何 命令 。{} 表 示 一 个 匹配 。 对 于 任何 匹配 的 文件 名 ，{} 均 会 被 该 文件 名 
所 替换 。 


我 们 使 用 > 操作 符 将 来 自 fing 的 数据 重 定向 到 all_c_files.txt 文 件 ， 没 有 使 用 >> ( 追加 ) 的 原 
因 是 因为 fing 命 令 的 全 部 输出 就 只 有 一 个 数据 流 ( stain )， 而 只 有 当 多 个 数据 流 被 追加 到 单个 
文件 中 时 才 有 必要 使 用 >>。 


例如 ， 用 下 列 命令 将 10 天 前 的 .txt 文 件 复制 到 OLD 目 录 中 : 














$ find 。 -type f -mtime +10 -name "*.txt" -exec cp {} OLD \; 


find 命 令 同样 可 以 采用 类 似 的 方法 与 其 他 命令 结合 起 来 。 





-exec 结 合 多 个 命令 


RS] 我 们 无 法 在 -exec 参 数 中 直接 使 用 多 个 命令 。 它 只 能 够 接受 单个 命令 ， 不 过 
ea 我 们 可 以 要 一 个 小 花招 。 把 多 个 命令 写 到 一 个 shell 脚 本 中 (例如 command.sh )， 然 
后 在 -exec 中 使 用 这 个 脚本 : 


-exec ./commands.sh {} \; 
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-exec 能 够 同 printf 结 合 来 生成 有 用 的 输出 信息 。 例 如 : 

$s find . -type f -name "*.txt" -exec printf "Text file: %s\n" {} \; 

10. 让 find 跳 过 特定 的 目录 

在 搜索 目录 并 执行 某 些 操作 时 ， 有 了 时 为 了 提高 性 能 , 需要 跳 过 一 些 子 目录 。 例如 ,程序 员 会 
在 版 本 控制 系统 ( 如 Git ) 管理 的 开发 源码 树 中 查找 特定 的 文件 ， 源 代码 层级 结构 中 的 每 个 子 目 
录 里 都 会 包含 一 个 .git 目 录 。( .git 存 储 每 个 目录 相关 的 版 本 控制 信息 。) 因为 与 版 本 控制 相关 的 目 
录 对 我 们 而 言 并 没有 什么 用 处 , 所 以 没 必要 去 搜索 这 些 目录 。 将 某 些 文件 或 目录 从 搜索 过 程 中 排 
除 在 外 的 技巧 被 称 为 修剪 ， 其 操作 方法 如 下 : 


$ find devel/source path \( -name ".git" -prune \) -o \( -type f -Print \) 

















# Instead of \( -type -print \) ,而 是 选择 需要 的 过 滤器 
以 上 命令 打印 出 不 包括 在 .git 目 录 中 的 所 有 文件 的 名 称 ( 路径 )。 
\( -name".git" -prune\) 的 作用 是 用 于 进行 排除 ， 它 指明 了 .git 目 录 应 该 被 排除 在 外 ， 


而 \( -type £ -print \) 指 明了 需要 执行 的 动作 。 这 些 动作 需要 被 放置 在 第 二 个 语句 块 中 ( 打 
印 出 所 有 文件 的 名 称 和 路 径 )。 





2.5 玩 转 xargs 
我 们 可 以 用 管道 将 一 个 命令 的 stgout (标准 输出 ) 重 定向 到 另 一 个 命令 的 stdain (标准 输 
入 )。 例如: 


cat foo.txt | grep "test" 

但 是 ， 有 些 命令 只 能 以 命令 行人 参数 的 形式 接受 数据 ， 而 无 法 通过 stdin 接 受 数 据 流 。 在 这 种 
情况 下 ， 我 们 没 法 用 管道 来 提供 那些 只 有 通过 命令 行 参数 才能 提供 的 数据 。 

那 就 只 能 另辟蹊径 了 。 该 xargs 命 令 出 场 了 ， 它 擅长 将 标准 输入 数据 转换 成 命令 行 参 数 。 
xargs 能 够 处 理 stgin 并 将 其 转换 为 特定 命令 的 命令 行 参数 。xargs 也 可 以 将 单行 或 多 行文 本 输 
人 转换 成 其 他 格式 ， 例 如 单行 变 多 行 或 是 多 行 变 单行 。 

Bash 用 户 都 爱 单行 命令 。 单 行 命令 是 一 个 命令 序列 ， 各 命令 之 间 不 使 用 分 号 ,而 是 使 用 管道 
操作 符 进 行 连接 。 精心 编写 的 单行 命令 可 以 更 高 效 、 更 简捷 地 完成 任务 。 就 文本 处 理 而 言 , 需要 
具备 扎实 的 理论 知识 和 实践 经 验 才能 够 写 出 适合 的 单行 命令 解决 方案 。xargs 就 是 构建 单行 命令 
的 重要 组 件 之 一 。 





































































































2.5.1 预备 知识 


xargs 命 令 应 该 紧 跟 在 管道 操作 符 之 后 ， 以 标准 输入 作为 主要 的 源 数 据 流 。 它 使 用 stain 并 
通过 提供 命令 行 参 数 来 执行 其 他 命令 。 例 如 : 
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command | xargs 


2.5.2 ”实战 演练 
xargs 命 令 把 从 stdain 接 收 到 的 数据 重新 格式 化 ， 再 将 其 作为 参数 提供 给 其 他 命令 。 
xargs 可 以 作为 一 种 替代 , 其 作用 类 似 于 finq 命 令 中 的 -exec。 下 面 是 各 种 xargs 命 令 的 使 区 
用 技巧 。 
口 将 多 行 输入 转换 成 单行 输出 。 
只 需要 将 换行 符 移 除 ， 再 用 " " (空格 ) 进行 代替 ， 就 可 以 实现 多 行 输入 的 转换 。' \n' 
被 解释 成 一 个 换行 符 , 换行 符 其 实 就 是 多 行文 本 之 间 的 定 界 符 。 利 用 xargs, 我 们 可 以 用 
空格 替换 掉 换 行 符 ， 这 样 就 能 够 将 多 行文 本 转换 成 单行 文本 : 
$ cat example.txt # 样 例文 件 
1234556 


7 8 9 10 
11 12 

















$ cat example.txt | xargs 
12345678910 11 12 


口 将 单行 输入 转换 成 多 行 输出 。 
指定 每 行 最 大 的 参数 数量 n ,我 们 可 以 将 任何 来 自 stain 的 文本 划分 成 多 行 ,每 行 4 个 参数 。 
每 一 个 参数 都 是 由 " ，( 空格 ) 隔 开 的 字符 串 。 空 格 是 默认 的 定 界 符 。 下 面 的 方法 可 以 将 
单行 划分 成 多 行 : 











$ cat example.txt | xargs -n 3 
二 23 

45 6 

7 8 9 

10 11 12 


2.5.3 工作 原理 


xargs 命 令 数量 众多 的 选项 使 其 能 够 适用 于 多 种 问题 场景 。 让 我 们 来 看 看 如 何 能 够 巧妙 地 运 
用 这 些 选项 来 解决 问题 。 


可 以 用 自己 的 定 界 符 来 分 隔 参 数 。 用 -a 选项 为 输入 指定 一 个 定制 的 定 界 符 : 








$ echo "splitXsplitxXsplitxXxsplit" | xargs -d xX 
split split split split 
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在 上 面 的 代码 中 ，stdin 是 一 个 包含 了 多 个 x 字 符 的 字符 串 。 我 们 可 以 用 -a 将 x 作为 输入 定 
界 符 。 在 这 里 ， 我 们 明确 指定 x 作为 输入 定 界 符 ， 而 在 默认 情况 下 ，xargs 采 用 内 部 字段 分 隔 符 
(空格 ) 作为 输入 定 界 符 。 

结合 -n 选 项 ， 我 们 可 以 将 输入 划分 成 多 行 ， 而 每 行 包含 两 个 参数 . 

$ echo "splitxXsplitxXsplitxXsplit" | xargs -dX -n2 


split split 
split split 


2.5.4 补充 内 容 


我 们 已 经 从 上 面 的 例子 中 学 到 了 如 何 将 stain 格 式 化 成 不 同 的 输出 形式 以 作为 参数 。 现 在 让 
我 们 来 学 习 如 何 将 这 些 参 数 传递 给 命令 。 


1. 读 取 stain， 将 格式 化 参数 传递 给 命令 








编写 一 个 小 型 的 定制 版 echo 来 更 好 地 理解 用 xargs 提 供 命令 行 参数 的 方法 : 


#!/bin/bash 
# 文 件 名 : cecho .sh 














echo S$*'#' 


当 参 数 被 传递 给 文件 cecho.sh 后 ， 它 会 将 这 些 参数 打印 出 来 ， 并 以 # 字 符 作为 结尾 。 例 如 : 





$ ./cecho.sh argl arg2 
argl arg2 # 


让 我 们 来 看 下 面 这 个 问题 。 
口 有 一 个 包含 着 参数 列表 的 文件 ( 每 行 一 个 参数 )。 我 需要 用 两 种 方法 将 这 些 参数 传递 给 一 
个 命令 ( 比如 cecho.sh )。 第 一 种 方法 ， 需 要 每 次 提供 一 个 参数 : 


./cecho.sh argl 
./cecho.sh arg2 
./cecho.sh arg3 


或 者 ， 每 次 需要 提供 两 个 或 三 个 参数 。 提 供 两 个 参数 时 ， 它 看 起 来 像 这 样 : 


./cecho.sh argl arg2 
./cecho .sh arg3 


口 第 二 种 方法 ， 需 要 一 次 性 提供 所 有 的 命令 参数 : 





./cecho .sh argl arg2 arg3 
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先 别 急 着 往 下 看 ， 试 着 运行 一 下 上 面 的 命令 ， 然 后 仔细 观察 输出 结果 。 


上 面 的 问题 也 可 以 用 xargs 来 解决 。 我们 有 一 个 名 为 args.txt 的 参数 列表 文件 ， 这 个 文件 的 内 
容 如 下 : 

$ cat args.txt 

argl 


arg2 
arg3 


就 第 一 个 问题 ， 我 们 可 以 将 这 个 命令 执行 多 次 ， 每 次 使 用 一 个 参数 : 


$ cat args .七 zt | xXargs -n 1 ./cecho.sh 
argl # 
arg2 # 
arg3 # 


每 次 执行 需要 x 个 参数 的 命令 时 ,使 用 : 
INPUT | xargs -n X 


例如 : 


$ cat args .七 zt | xXargs -n 2 ./cecho.sh 
argl arg2 # 
arg3 # 


就 第 二 个 问题 ， 为 了 在 执行 命令 时 一 次 性 提供 所 有 的 参数 ， 可 以 使 用 : 





$ cat args .七 zt | xargs ./cecho.sh 
arg1 arg2 arg3 # 


在 上 面 的 例子 中 ， 我 们 直接 为 特定 的 命令 ( 例如 cecho.sh ) 提供 命令 行 参 数 。 这 些 参数 都 源 
于 args.txt 文 件 。 但 实际 上 除了 它们 外 ,我 们 还 需要 一 些 固定 不 变 的 命令 参数 。 思 考 下 面 这 种 命令 
格式 : 




















./cecho.sh -p argl -1 


在 上 面 的 命令 执行 过 程 中 ，arg1 是 唯一 的 可 变 内 容 ， 其 余部 分 都 保持 不 变 。 我 们 可 以 从 文 
件 (args.txt ) 中 读 取 参数 ， 并 按照 下 面 的 方式 提供 给 命令 : 





./cecho.sh -p argl -1 
./cecho.sh -p arg2 -1 
./cecho.sh -p arg3 -1 


xargs 有 一 个 选项 -I, 可 以 提供 上 面 这 种 形式 的 命令 执行 序列 。 我 们 可 以 用 -I 指定 蔡 换 字符 
串 ， 这 个 字符 串 在 xargs 扩 展 时 会 被 蔡 换 掉 。 如 果 将 -TI 与 xargs 结 合 使 用 ， 对 于 每 一 个 参数 ， 命 
令 都 会 被 执行 一 次 。 
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试 试 下 面 的 用 法 : 


$ cat args.txt | xargs -I {} ./cecho.sh -p {} -1 
-p argl -1 # 
-p arg2 -1 # 
-p arg3 -1 # 


- 工 {} 指定 了 替换 字符 串 。 对 于 每 一 个 命令 参数 ， 字 符 串 { 都 会 被 从 stdin 读 取 到 的 参数 蔡 
换 掉 。 








KS 使 用 -I 的 时 候 ， 命 令 以 循环 的 方式 执行 。 如 果 有 3 个 参数 ， 那 么 命令 就 会 连 
同 {} 一 起 被 执行 3 次 。 在 每 一 次 执行 中 {} 都 会 被 蔡 换 为 相应 的 参数 。 


2. 结合 find 使 用 xargs 


xargs 和 find 算 是 一 对 死党 。 两 者 结合 使 用 可 以 让 任务 变 得 更 轻松 。 不 过 人 们 通常 却 是 以 一 
种 错误 的 组 合 方式 使 用 它们 。 例 如 : 








$ find . -type f -name "*.txt" -print | xargs rm -f 

这 样 做 很 危险 。 有 时 可 能 会 删除 不 必要 删除 的 文件 。 我 们 没 法 预测 分 隔 fEing 命 令 输 出 
的 定 界 符 究 竞 是 什么 ('\n' 或 者 ' ')。 很 多 文件 名 中 都 可 能 会 包含 空格 符 ('， ' )， 因此 xargs 
很 可 能 会 误 认 为 它们 是 定 界 符 ( 例如 ，hell text.txt 会 被 xzargs 误 解 为 hell 和 text.txt )。 

只 要 我 们 把 find 的 输出 作为 xargs 的 输入 , 就 必须 将 -print0 与 find 结 合 使 用 , 以 字符 null 
('\0' ) 来 分 隔 输出 。 


用 find 匹 配 并 列 出 所 有 的 ,txt 文件， 然后 用 xargs 将 这 些 文件 删除 : 














$ find . -type f -name "*.txt" -print0 | xargs -0 rm -f 
这 样 就 可 以 删除 所 有 的 .txt 文 件 。xargs -0 将 \0 作 为 输入 定 界 符 。 
3. 统计 源 代码 目录 中 所 有 C 程 序 文件 的 行 数 


统计 所 有 C 程 序 文件 的 行 数 ( Lines of Code，LOC ) 是 大 多 数 程序 员 都 会 遇 到 的 任务 。 完 成 
这 项 任务 的 代码 如 下 : 























$ find source code dir path -type 上 -name "*.c" -print0 | xargs -0 wc -1 


如 果 你 想 获 得 有 关 个 人 源 代码 更 多 的 统计 信息 ,有 个 叫做 SLOCCount 的 工具 
CI 可 以 派 上 用 场 。 现代 GNU/Linux 发 行 版 一 般 都 包含 这 个 软件 包 , 或 者 你 也 可 以 从 
http://www.dwheeler.com/sloccount/ 处 下 载 。 
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4. 结合 stdin， 巧 妙 运用 while 语 和 句 和 子 shell 


xargs 只 能 以 有 限 的 儿 种 方式 来 提供 参数 ， 而 且 它 也 不 能 为 多 组 命令 提供 参数 。 要 执行 包含 
来 自 标准 输入 的 多 个 参数 的 命令 ， 有 一 种 非常 灵活 的 方法 。 包 含 while 循 环 的 子 shell 可 以 用 来 读 
取 参 数 ， 然 后 通过 一 种 巧妙 的 方式 执行 命令 : 


$ cat files.txt | ( while read arg; do cat $arg; done ) 
# 等 同 于 cat files.txt | xargs -I {} cat {} 


在 while 循 环 中 ， 可 以 将 cat $arg 替 换 成 任意 数量 的 命令 ,这 样 我 们 就 可 以 对 同一 个 参数 
执行 多 条 命令 。 也 可 以 不 借助 管道 , 将 输出 传递 给 其 他 命令 。 这 个 技巧 能 够 适用 于 各 种 问题 场景 。 
子 shell 操 作 符 内 部 的 多 个 命令 可 作为 一 个 整体 来 运行 。 

$ cmd0 | ( cmd1l;cmd2;cmd3) | cmd4 


如 果 cma1 是 cq /, 那么 就 会 改变 子 shell 工 作 目 录 , 然而 这 种 改变 仅 局 限于 子 shell 内 部 。cmq4 
则 完全 不 知道 工作 目录 发 生 了 变化 。 





2.6 用 tr 进行 转换 


cz 是 Unix 命 令 行 专家 工具 箱 中 一 件 简约 却 不 失 精 美的 工具 。 它 经 常用 来 编写 优美 的 单行 命 
令 ， 作 用 不 容 小 视 。tz 可 以 对 来 自 标准 输入 的 内 容 进行 字符 替换 、 字 符 删 除 以 及 重复 字符 压缩 。 
它 可 以 将 一 组 字符 变 成 另 一 组 字符 ， 因 而 通常 也 被 称 为 转换 (translate ) 命令 。 在 这 则 攻略 中 ， 
我 们 会 看 到 如 何 使 用 tr 进行 基本 的 集合 转换 。 




















2.6.1 预备 知识 
tr 只 能 通过 stdin ( 标准 输入 )， 而 无 法 通过 命令 行 参数 来 接受 输入 。 它 的 调用 格式 如 下 : 





tr [options] setl1 set2 


将 来 自 stain 的 输入 字符 从 set1 映 射 到 set2， 然 后 将 输出 写 入 stdout (标准 输出 )。set1 
和 set2 是 字符 类 或 字符 集 。 如 果 两 个 字符 集 的 长 度 不 相等 ， 那 么 set2 会 不 断 重复 其 最 后 一 个 字 
符 ， 直 到 长 度 与 set1 相 同 。 如 果 set2 的 长 度 大 于 set1， 那 么 在 set2 中 超出 set1 长 度 的 那 部 分 
字符 则 全 部 被 忽略 。 

















2.6.2 ”实战 演练 
将 输入 字符 由 大 写 转 换 成 小 写 ， 可 以 使 用 下 面 的 命令 : 


$ echo "HELLO WHO IS THIS" | tr 'A-Z' 'a-2z' 
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'A-Z' 和 'a-z' 都 是 集合 。 我 们 可 以 按照 需要 追加 字符 或 字符 类 来 构造 自己 定制 的 集合 。 


'ABD-}'、'aA.,'、'a-ce-x' 以 及 'a-c0-9' 等 均 是 合法 的 集合 。 定 义 集合 也 很 简单 ， 不 
需要 书写 一 长 串 连 续 的 字符 序列 ， 只 需要 使 用 “起 始 字 符 -终止 字符 ”这 种 格式 就 行 了 。 这 种 写 
法 也 可 以 和 其 他 字符 或 字符 类 结合 使 用 。 如 果 “ 起 始 字符 -终止 字符 ”不 是 一 个 连续 的 字符 序列 ， 
那么 它 就 会 被 视 为 包含 了 3 个 元 素 的 集合 , 也 就 是 : 起 始 字符 , -, 终止 字符 。 你 可 以 使 用 像 '\t'、 
'\n' 这 种 特殊 字符 ， 也 可 以 使 用 其 他 ASCI 字 符 。 



























































2.6.3 工作 原理 


通过 在 tr 中 使 用 集合 的 概念 , 我 们 可 以 轻松 地 将 字符 从 一 个 集合 映射 到 另 一 个 集合 中 。 下面 
过 一 则 示例 看 看 如 何 用 tr 进行 数字 加 密 和 解密 。 


$ echo 12345 | tr '0-9' '9876543210' 
87654 # 已 加 密 

















[Ee 


$ echo 87654 | tr '9876543210' '0-9' 
12345 # 已 解密 


再 来 看 另外 一 个 有 趣 的 例子 。 


ROT13 是 一 个 著名 的 加 密 算 法 。 在 ROT13 算 法 中 ,文本 加 密 和 解密 都 使 用 同一 个 函数 .ROT13 
按照 字母 表 排 列 顺序 执行 13 个 字母 的 转换 。 用 tr 进行 ROT13 加 密 : 























$ echo "tr came, tr saw, tr conquered." | tr 'a-zA-Z' 'n-za-mN-ZA-M' 
得 到 输出 : 

ge pnzr, ge fnj, ge pbadhrerq. 

对 加 密 后 的 密 文 再 次 使 用 同样 的 ROT13 函 数 ， 我 们 采用 : 

$ echo ge pnzr, ge fnj, ge pbadhrerqg. | tr 'a-zA-Z' 'n-za-mN-ZA-M' 
得 到 输出 : 

tr came, tr saw, tr conquered. 


tr 还 可 以 用 来 将 制 表 符 转 换 成 空格 : 





$ tr '\t' ' ' < file.txt 


2.6.4 补充 内 容 
我 们 已 经 看 到 了 tr 的 一 些 基本 转换 功能 ， 接 下 来 看 看 tr 还 能 帮 我 们 实现 的 其 他 功能 。 
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1. 用 tr 删除 字符 
t+ 有 一 个 选项 -a， 可 以 通过 指定 需要 被 删除 的 字符 集合 ,将 出 现在 stdin 中 的 特定 字符 清除 
掉 : 


$ cat file.txt | tr -d '[set1]' 
# 只 使 用 set1， 不 使 用 set2 


例如 : 


$ echo "Hello 123 world 456" | tr -d '0-9' 
Hello world 


# 将 stdin 中 的 数字 删除 并 打印 出 来 























2. 字符 集 补 集 

我 们 可 以 利用 选项 -c 来 使 用 set1 的 补 集 。 下 面 的 命令 中 ，set2 是 可 选 的 : 
tr -c [set1] [set2] 

set1 的 补 集 意味 着 这 个 集合 中 包含 set1 中 没有 的 所 有 字符 。 

最 典型 的 用 法 是 从 输入 文本 中 将 不 在 补 集 中 的 所 有 字符 全 部 删除 。 例 如 : 


$ echo hello 1 char 2 next 4 | tr -d -c '0-9 \n' 
1 2 4 


在 这 里 ， 补 集中 包含 了 除数 字 、 空 格 字符 和 换行 符 之 外 的 所 有 字符 。 因 为 指定 了 -a, 所 以 这 
些 字符 全 部 都 被 删除 。 
3. 用 tr 压缩 字符 


tr 命令 在 很 多 文本 处 理 环境 中 大 有 用 武之 地 。 多 数 情况 下 ,连续 的 重复 字符 应 该 压缩 成 单个 
字符 。 经 常 需 要 从 事 的 一 项 任务 就 是 压缩 空白 字符 。 


tz 的 -s 选 项 可 以 压缩 输入 中 重复 的 字符 ， 方 法 如 下 : 





$ echo "GNU is not UNIX. Recursive right ?" | tr -s ! 
GNU is not UNIX. Recursive right ? 
# tr -s '[set]' 


让 我 们 用 一 种 巧妙 的 方式 用 tr 将 文件 中 的 数字 列表 进行 相 加 : 
cat sum.txt 


$ 
1 
2 
3 
4 





$ cat sum.txt | echo $[ $(tr '\n' '+' ) 0 1 
15 


这 一 招 是 如 何 起 效 的 ? 


在 上 面 的 命令 中 ，tr 用 来 将 '\n' 替 换 成 '+' ， 因 此 我 们 得 到 了 字符 串 "1+2+3+…5+"， 但 是 
在 字符 串 的 尾部 多 了 一 个 操作 符 +。 为 了 抵消 这 个 多 出 来 的 操作 符 ， 我 们 再 追加 一 个 0。 


$[ operation ] 执 行 算 术 运 算 ， 因 此 得 到 下 面 的 字符 串 : 








echo $[ 1+2+3+4+5+0 ] 


如 果 我 们 利用 循环 从 文件 中 读 取 数字 ， 然 后 再 进行 相 加 , 那 肯 定 得 用 好 几 行 代码 。 而 如 今 只 
用 一 行 就 搞定 了 。 


还 可 以 像 下面 这 样 使 用 tr， 以 按 除 多 余 的 换行 符 : 


























$ cat multi blanks.txt | tr -s '\n' 
linel 
line2 
line3 
line4 


在 上 例 中 ，tr 将 多 余 的 '\n' 字 符合 并 为 单一 的 '\n' (换行 符 )。 





4. 字符 类 
tr 可 以 像 使 用 集合 一 样 使 用 各 种 不 同 的 字符 类 ， 这 些 字符 类 如 下 所 示 : 


口 alnum: 字母 和 数字 。 

口 alpha: 字母 。 

口 cntr1: 控制 〈 非 打印 ) 字符 。 
D aigit: 数字 。 

口 graph: 图 形 字符 。 

口 lower: 小 写字 母 。 

口 print: 可 打印 字符 。 

口 bunct : 标点 符号 。 

口 space: 空白 字符 。 

口 upper: 大 写字 母 。 

口 xdigit; 十 六 进 制 字符 。 

















2.7 ”核验 和 与 核实 63 





可 以 按照 下 面 的 方式 选择 并 使 用 所 需 的 字符 类 : 
tr [:class:] [:class:] 
例如 : 


tr '[:lower:]' '[:upper:]"' 


2.7 校 验 和 与 核实 


校 验 和 ( checksum ) 程序 用 来 从 文件 中 生成 校 验 和 密 钥 ,然后 利用 这 个 校 验 和 密 钥 核实 文件 
的 完整 性 。 文件 可 以 通过 网 络 或 任何 存储 介质 分 发 到 不 同 的 地 点 。 出 于 多 种 原因 ,数据 有 可 能 在 
传输 过 程 中 丢失 了 若干 位 ,从 而 导致 文件 损坏 。 这 种 错误 通常 发 生 在 从 Internet 上 下 载 文件 , 通过 
网 络 传输 文件 ， 或 者 CD 光盘 损坏 等 。 


此 , 我 们 需要 采用 一 些 测试 方法 来 确定 接收 到 的 文件 是 否 存在 错误 。 用 于 文件 完整 性 测试 
的 特定 密 钥 就 称 为 校 验 和 。 

我 们 对 原始 文件 和 接收 到 的 文件 都 进行 校 验 和 计算 。 通 过 比 对 两 者 的 校 验 和 ， 就 能 够 核实 
接收 到 的 文件 是 否 正 确 。 如果 校 验 和 (一 个 来 自发 送 地 的 原始 文件 , 另 一 个 来 自 目的 地 的 接收 文件 ) 
相等 ， 就 意味 着 我 们 接收 到 了 正确 的 文件 ， 否 则 用 户 就 不 得 不 重新 发 送 文件 并 再 次 比 对 校 验 和 。 

校 验 和 对 于 编写 备份 脚本 或 系统 维护 脚本 来 说 非常 重要 , 因为 它们 都 会 涉及 通过 网 络 传输 文 
件 。 通过 使 用 校 验 和 核实 , 我 们 就 可 以 识别 出 那些 在 网 络 传输 过 程 中 出 现 损坏 的 文件 , 并 进行 重 发 。 


在 这 则 攻略 中 ， 我 们 会 学 习 如 何 计算 校 验 和 验证 数据 完整 性 。 




































































2.7.1 预备 知识 

最 知名 且 使 用 最 为 广泛 的 校 验 和 技术 是 md5sum 和 SHA-1。 它 们 对 文件 内 容 使 用 相应 的 算法 
来 生成 校 验 和 。 下 面 就 来 看 看 如 何 从 文件 中 生成 校 验 和 并 核实 文件 的 完整 性 。 
2.7.2 ”实战 演练 

为 了 计算 mdssum， 使 用 下 列 命令 : 


$ md5sum filename 
68b329da9893e34099c7d8ad5cb9c940 filename 


如 上 所 示 ，mq5sum 是 一 个 32 个 字符 的 十 六 进 制 串 。 


将 输出 的 校 验 和 重 定 向 到 一 个 文件 ， 然 后 用 这 个 MD5 文 件 核实 数据 的 完整 性 : 





$ md5sum filename > file sum.md5 
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2.7.3 工作 原理 
md5sum 校 验 和 计算 的 方法 如 下 : 


$ md5sum filel file2 file3 .. 
当 使 用 多 个 文件 时 ， 和 输出 中 会 在 每 行 中 包含 单个 文件 的 校 验 和 ; 


[checksuml] filel 
[checksuml] file2 
[checksuml] file3 


可 以 按照 下 面 的 方法 用 生成 的 文件 核实 数据 完整 性 : 

$ md5sum -c file sum.md5 

# 这 个 命令 会 输出 校 验 和 是 否 匹 配 的 消息 

如 果 需 要 用 所 有 的 .ma5 信 息 来 检查 所 有 的 文件 ， 可 以 使 用 : 
$ md5sum -c *.md5 


与 md5sum 类 似 ，SHA-1 是 男 一 种 常用 的 校 验 和 算法 。 它 从 给 定 的 输入 文件 中 生成 一 个 长 度 
为 40 个 字符 的 十 六 进 制 串 。 用 来 计算 SAH-1 串 的 命令 是 shalsum。 其 用 法 和 mq5sum 的 非常 相似 。 
只 需要 把 先前 讲 过 的 那些 命令 中 的 ma5sum 替 换 成 shalsum 就 行 了 ， 记 住 将 输入 文件 名 从 
file_ sum.md5 改 为 file_sum.shal。 


校 验 和 对 于 核实 下 载 文件 的 完整 性 非常 有 帮助 。 我 们 从 网 上 下 载 的 ISO 镜像 文件 一 般 更 容易 
出 现 错误 ( 见 图 2-1 )。 为 了 检查 接收 文件 正确 与 否 ， 校 验 和 得 以 广泛 应 用 。 校 验 和 程序 对 同样 的 
文件 数据 始终 生成 一 模 一 样 的 校 验 和 。 
































种 和 入 Kubuntyu 12.10 [Quantal Quetzalj - Wozila Frafpx{PrivateBrowsing) NS 
Fireiox~ | Kubuntu 12.19 (Guontal Quctzel) | 
交趾 ， B se cimase. ubuntu.com/kubunii/re -~v | | Socele | 从 圆 v | vi 
| 元 
S| 
Nama Last mocit1ed Size Description 





2arant Directory 





Mp5sUnS 18-0ct-2012 11;29 273 
MD55UMS-mztalink 18-0ct-2012 11:29 293 
MD55UMS-metalink .gpg lg-0ct-2012 11:29 198 
YDS5UMS, g9g lg-0ct-2012 11:29 198 
SHALSUMS I8-Det-2612 11;29 365 | 
SHALSUMS gpg 18-0Oct-2012 11;29 198 | 
SHA2S6SUMS 18-Qet-2012 11:29 ZNT 
[ SHA2565UM5 ,ypg 18-Qct-2012 11:29 198 
xubuntJ-12, 19-desktop-amd64+mac ,iso 17-0ct-2012 17:15 9g32M Desktop inage for 





zubuntJ-127.19-desktnp-amd64rmac isn tnrrent 18-net-26127 11:29 37K Desktap inage for| 





| | <ubJntJ-12.13-desktop-amd64tmac ,iso,zsync 18-0ct-2012 11:28 1.8M Desktop inage forS 
六 

| 
© | 











图 2-1 
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图 2-2 是 md5sum 生 成 的 校 验 和 。 





| 灸 和 Mozilla Firefox (Private Browsing) 
FiefoxY | @@ httpy/secdimag..release/MD5SUMS | 
| 字 -ME sseubunt vv 人 @| 划 v coo 的 合 加 >- 区 | 
z | 


6478eeb4fa6822548b6d4214503b6825 *kubuntu-12.10-desktop-amd64+mac.150 

dc63881988af54677ab3084d031812b6 *kubuntu-12.10-desktop-amd64.is0 

1447e289560cae92562c948907dd591c *#kubuntu-12,10-desktop-armhf+omap4, 1mg 
| Secfb4036892f1619961d22c1a763103 #kubuntu-12,19-desktop-i386.iso 





豆 | 


2.7.4 补充 内 容 
对 于 多 个 文件 ， 校 验 和 同样 可 以 发 挥 作 用 。 现 在 就 看 看 如 何 校 验 并 核实 多 个 文件 。 
对 目录 进行 校 验 


校 验 和 是 从 文件 中 计算 得 来 的 。 对 目录 计算 校 验 和 意味 着 我 们 需要 对 目录 中 的 所 有 文件 以 递 
归 的 方式 进行 计算 。 








这 可 以 用 命令 md5deep 或 shaldeep 来 实现 。 首 先 ， 需要 安装 md5deep 软 件 包 以 确保 能 找到 
这 些 命令 。 该 命令 的 用 法 如 下 : 

$ md5deep -rl directory path > directory.md5 

# -r 使 用 递归 的 方式 

# -1 使 用 相对 路 径 。 默 认 情 况 下 ，mqd5deep 会 输出 文件 的 绝对 路 径 

或 者 也 可 以 结合 fingd 来 递归 计算 校 验 和 : 

$ find directory path -type 上 -print0 | xargs -0 md5sum >> directory.md5 


用 下 面 的 命令 进行 核实 : 
$ md5sum -c directory.md5 
2.8 加 密 工 具 与 散 列 
加 密 技 术 主要 用 于 防止 数据 遭受 未 经 授权 的 访问 。 加 密 算法 有 很 多 , 我 们 会 着 重 讲解 那些 常 


见 的 标准 加 密 算 法 。 在 Linux 环 境 下 有 一 些 工 具 可 以 用 来 执行 加 密 和 解密 。 有 时 我 们 使 用 加 密 算 
法 散 列 值 来 验证 数据 的 完整 性 。 本 节 将 介绍 一 些 常 用 的 加 密 工 具 以 及 这 些 工 具 所 涉及 的 算法 。 




















实战 演练 


让 我 们 看 看 crypt 、gpg、base64、md5sum、shalsum 以 及 openss1l 的 用 法 。 
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口 crypt 是 一 个 简单 的 加 密 工 具 , 它 从 stdin 接 受 一 个 文件 以 及 口令 作为 输入 ,然后 将 加 密 
数据 输出 到 staout ( 因此 要 对 输入 、 输 出 文件 使 用 重 定 向 )。 





$ crypt <input file >output file 
Enter passphrase: 


它 会 要 求 输入 一 个 口令 。 我 们 也 可 以 通过 命令 行 参 数 来 提供 口令 。 
$ crypt PASSPHRASE <input_ file >encrypted file 

如 果 需 要 解密 文件 ， 可 以 使 用 : 

$ crypt PASSPHRASE -d <encrypted_file >output file 


口 gpg( GNU 隐 私 保 护 ) 是 一 种 应 用 广泛 的 工具 , 它 使 用 加 密 技术 来 保护 文件 ， 以 确保 数据 
在 送 达 目的 地 之 前 无 法 被 读 取 。 这 里 我 们 讨论 如 何 加 密 、 解 密 文 件 。 











gpg 签 名 同样 广泛 用 于 在 电子 邮件 通信 中 的 邮件 “签名 ”， 以 
> 证 明 发 送 方 的 真实 性 。 


用 gpg 加 密 文 件 : 
$ gpg -c filename 


该 命令 采用 交互 方式 读 取 口令 ， 并 生成 他 ename.gpg。 使 用 以 下 命令 解密 gpg 文 件 : 





$ gpg filename.gpg 


该 命令 读 取 口令 ， 然 后 对 文件 进行 解密 。 


本 书 并 没有 涉及 gpg 的 过 多 细节 。 如 果 你 感 兴趣 ， 和 希望 进 一 
~ 步 了 解 ， 请 访问 http://en.wikipedia.org/wiki/GNU_Privacy_Guard。 











口 Base64 是 一 组 相似 的 编码 方案 ， 它 将 ASCII 字 符 转 换 成 以 64 为 基数 的 形式 ( radix-64 
representation )， 以 可 读 的 ASCIH 字 符 串 来 描述 二 进 制 数 据 。base64 命 令 可 以 用 来 编码 / 解 
人 码 Base64 字 符 串 。 要 将 文件 编码 为 Base64 格 式 ， 可 以 使 用 : 





























$ base64 filename > outputfile 
或 者 

$ cat file | base64 > outputfile 
base64 可 以 从 stdin 中 进行 读 取 。 
解码 Base64 数 据 : 


2.8 
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口 


$ base64 -d file > outputfile 
或 者 


$ cat base64_file | base64 -d > outputfile 

















md5sum 与 shalsum 都 是 单 向 散 列 算法 ， 均 无 法 道 推 出 原始 数据 。 它 们 通常 用 于 验证 数据 


完整 性 或 为 特定 数据 生成 唯一 的 密 钥 : 


$ md5sum file 
8503063d5488c3080d4800ff50850dc9 file 


$ shalsum file 
lba02b66e2e557fede8f61b7df282cd0a27b816b file 














这 种 类 型 的 散 列 算法 是 存储 密码 的 理想 方案 。 密 码 使 用 其 对 应 的 散 列 值 来 存储 。 如 果 某 
个 用 户 需 要 进行 认证 ， 读 取 该 用 户 提供 的 密码 并 转换 成 散 列 值 ， 然 后 将 其 与 之 前 存储 的 











散 列 值 进行 比 对 。 如 果 相 同 ， 用 户 就 通过 认证 ， 被 允许 访问 ; 
将 密码 以 明文 形式 存储 是 件 非常 冒险 的 事 ， 会 面临 安全 风险 。 




















尽管 使 用 广泛 , md5sum 和 SHA-1 已 不 再 安全 


否则 ， 就 会 被 拒绝 访问 。 


。 因 为 计算 能 


的 攀升 使 其 变 得 容易 被 破解 。 推 荐 使 用 pcrypt 或 sha512sum 这 
> 类 工具 进行 加 密 。 详 情 可 参看 http://codahale.com/how-to-saftyly- 


store-a-password/。 


shadow-like 散 列 〈salt 散 列 ) 


让 我 们 看 看 如 何 为 密码 生成 shadow-like salt 散 列 。 在 Linux 中 , 用 户 密码 是 以 散 列 值 形式 存 
储 在 文件 /etc/shadow 中 的 。 该 文件 中 的 典型 内 容 类 似 于 下 面 这 样 : 





test:$6$fG4eWdUi$ohTKOlEUZNk77 .4S8MrYe07NTRV4M3LrJnZP9p. 
FUal8ENRH7F70zhodas3cR.:14790:0:99999:7::: 


qclbR5c .EcOruzPXfEululoB 


该 行 中 的 $s6$foG4ewWdUi$ohTKOlEUZNk77.4S8MrYe07NTRV4M3LrJjJnZP9p.qclbR5c. 
EcOruzPXfEululoBFUal8ENRH7F70zhodas3cR 是 密码 对 应 的 shadow 散 列 值 。 





某 些 情况 下 ， 我 们 得 编写 一 些 至 关 重 要 的 管理 脚本 ， 这 些 脚 本 也 许 需要 编辑 密码 ， 或 是 














需要 用 shell 肢 本 手动 添加 用 户 。 这 时 我 们 必须 生成 shadow 密 码 字 符 串 ， 并 向 shadow 文 件 


中 写 入 与 上 面 类 似 的 文本 行 。 下 面 让 我 们 看 看 如 何 用 openss 


shadow 密 码 通常 都 是 salt 密 码 。 所 谓 SALT 就 是 额外 的 一 个 字符 




















成 密码 的 salt 散 列 值 。 


1 生成 shadow 密 码 。 








,用 来 起 一 个 混淆 的 作用 ， 


使 加 密 更 加 不 易 被 破解 。salt 由 一 些 随机 位 组 成 ,被 用 作 密 钥 生 成 函数 的 输入 之 一 ， 以 生 
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关于 salt 的 更 多 细节 信息 ， 请 参考 维基 百科 页 面 http://en. 
一 wikipedia.org/wiki/Salt (cryptography)。 


$ opensslpasswd -1 -Salt SALT _ STRING PASSWORD 
$1$SALT _ STRINGS323VkWkSLHuhbt1LzkSsUG 。 


将 SALT_sTRING 替 换 为 随机 字符 串 ， 并 将 PASsworD 替 换 成 你 想 要 使 用 的 密码 。 











2.9 排序 、 唯 一 与 重复 


同文 本 文件 打交道 时 , 少不了 要 用 到 排序 。sort 命 令 能 够 帮助 我 们 对 文本 文件 和 stdin 进 行 
排序 操作 。 它 通常 会 配合 其 他 命令 来 生成 所 需要 的 输出 。unia 是 一 个 经 常 与 sort 一 同 使 用 的 命 
令 。 它 的 作用 是 从 文本 或 stgin 中 提取 唯一 (或 重复 ) 的 行 。 这 则 攻略 将 演示 sort 和 uniq 命 令 
的 常见 用 法 。 





























2.9.1 预备 知识 


sort 命 令 既 可 以 从 特定 的 文件 ， 也 可 以 从 stain 中 获取 输入 ， 并 将 输出 写 入 stdout。 uniq 
的 工作 方式 和 sort 一 样 。 





2.9.2 ”实战 演练 
(1) 我 们 可 以 按照 下 面 的 方式 轻松 地 对 一 组 文件 ( 例如 filel.txt 和 file2.txt ) 进行 排序 : 


$ sort filel.txt file2.txt > sorted.txt 

或 是 

$ sort filel.txt file2.txt -o sorted.txt 
CO) 按照 数字 顺序 进行 排序 : 


$ sort -n file.txt 





(3) 按照 逆序 进行 排序 : 
$ sort -r file.txt 

(4) 按照 月 份 进 行 排序 ( 依照 一 月 ， 二 月 ， 三 月 …… ): 
$ sort -M months.txt 

(5) 合并 两 个 已 排序 过 的 文件 : 


$ sort -m Sortedl sorted2 
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(6) 找 出 已 排序 文件 中 不 重复 的 行 : 
$ sort filel.txt file2.txt | uniqg 


(7) 检查 文件 是 否 已 经 排序 过 : 





#!/bin/bash 

# 功 能 描述 : 排序 

sort -C filename ; 

if [ $? -eq 0 ]; then 
echo Sorted; 

else 
echo Unsorted; 

二 


将 filename 替 换 成 你 需要 进行 检查 的 文件 名 ， 然 后 运行 该 脚本 。 








2.9.3 工作 原理 


sort 命 令 包含 大 量 的 选项 ， 能 够 对 文件 数据 进行 各 种 排序 。 如 果 使 用 uniq 命 令 ， 那 sort 更 
是 必 不 可 少 ， 因 为 前 者 要 求 输入 数据 必须 经 过 排序 。 


sort 和 unia 可 以 应 用 于 多 种 场景 。 让 我 们 来 看 一 下 这 些 命令 的 各 种 选项 及 用 法 。 


要 检查 文件 是 否 排序 过 ， 可 以 采用 以 下 方法 : 如 果 文 件 已 经 排序 ，sort 会 返回 为 0 的 退出 码 
($? )， 和 否则 返回 非 0。 


























2.9.4 补充 内 容 
我 们 已 经 介绍 了 sort 命 令 的 基本 用 法 。 下 面 来 看 看 如 何 利 用 sort 来 完成 一 些 复杂 的 任务 。 
1. 依据 键 或 列 进行 排序 
我 们 可 以 按 列 将 下 面 的 文本 排序 : 
$ cat data.txt 
1 mac 2000 
2 vwinxp 4000 
3 
4 


bsd 1000 
linux 1000 











有 很 多 方法 可 以 对 这 段 文 本 排序 。 目 前 它 是 按照 序号 (第 一 列 ) 来 排序 的 。 我 们 也 可 以 依据 
第 二 列 和 第 三 列 来 排序 。 


-k 指 定 了 排序 应 该 按照 哪 一 个 键 ( key ) 来 进行 。 键 指 的 是 列 号 ， 而 列 号 就 是 执行 排序 时 的 
依据 。-t 告 诉 sort 命 令 按照 着 序 进行 排序 。 例 如 : 
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将 


和 寺 定 范 围 内 的 一 组 字符 ( 例如， keyl=character4-character8 ) 作为 键 。 


依据 第 1 列 ， 以 逆序 形式 排序 

sort -nrk 1 data.txt 

linux 1000 

bsd 1000 

winxp 4000 

mac 2000 

-nz 表明 按照 数字 ， 采 用 逆序 形式 排序 


着 马 Dw 如 站 


依据 第 2 列 进行 排序 

sort -k 2 data.txt 
bsd 1000 

linux 1000 

mac 2000 

winxp 4000 


DPcWUWH# 


一 定 要 留意 用 于 按 数 字 顺序 进行 排序 的 选项 -na。sort 命 令 对 于 字母 表 排 序 
和 数字 排序 有 不 同 的 处 理 方式 。 因 此 ， 如 果 要 采用 数字 顺序 排序 ， 就 应 该 明确 


地 给 出 -n 选 项 。 

















通常 在 默认 情况 下 , 键 就 是 文本 文件 中 的 列 。 列 与 列 之 间 用 空格 分 隔 。 但 有 时 候 , 我 们 需要 











在 这 种 情况 下 ， 


必须 明确 地 将 键 指定 为 某 个 范围 内 的 字符 ， 这 个 范围 可 以 用 键 起 止 的 字符 位 置 来 表明 。 例 如 : 


$ cat data.txt 
1l01l0hellothis 
2189ababbba 
7464dfddfdfd 

$ sort -nk 2,3 data.txt 











把 醒目 的 字符 作为 数值 键 。 为 了 提取 这 个 键 ,用 字符 在 行内 的 起 止 位 置 作为 键 的 书写 格式 ( 在 
上 面 的 例子 中 ， 起 止 位 置 是 2 和 3 )。 








用 第 一 个 字符 作为 键 : 
$ sort -nk 1,1 data.txt 
为 了 使 sort 的 输出 与 以 \0 作 为 终止 符 的 xargs 命 令 相 兼容 ， 采 用 下 面 的 命令 


$ sort -z data.txt | xargs -0 


# 终止 符 \0 用 来 保证 Xargs 命 令 的 使 用 安全 


有 时 文本 中 可 能 会 包含 一 些 像 空格 之 类 的 不 必要 的 多 余 字 符 。 如 果 需 要 忽略 这 些 字 








字典 序 进 行 排序 ， 可 以 使 用 : 


其 中 ， 选 项 -b 用 于 忽略 文件 中 的 前 导 空白 行 ， 选 项 -a 用 于 指明 以 字典 序 进行 排序 。 


$ sort -bd unsorted.txt 


符 , 并 以 


2.9 排序 、 





2. unid 


unig 命 令 通 过 消除 重复 内 容 ， 从 给 定 输入 中 (stain 或 命令 行 参数 文件 ) 找 出 唯一 的 行 。 它 


也 可 以 用 来 找 出 输入 中 出 现 的 重复 行 。 


unigq 只 能 作用 于 排 过 序 的 数据 输入 ， 因此 ， unig 要 人 么 使 用 管道 
输入 ， 与 sort 命 令 结 合 使 用 。 





你 可 以 按照 下 面 的 方式 从 给 定 的 输入 数据 中 生成 唯一 的 行 ( 所 谓 














的 所 有 行 都 会 被 打印 出 来 ， 但 是 其 中 重复 的 行 只 会 被 打印 一 次 ): 


$ cat sorted.txt 
bash 
foss 
hack 
hack 


$ uniq sorted.txt 
bash 
foss 
hack 





$ sort unsorted.txt | uniqg 


只 显示 唯一 的 行 ( 在 输入 文件 中 没有 重复 出 现 的 行 ): 














$ uniq -u sorted.txt 
bash 
foss 





$ sort unsorted.txt | uniqg -u 
要 统计 各 行 在 文件 中 出 现 的 次 数 ， 使 用 下 面 的 命令 


$ sort unsorted.txt | uniq -c 
1 bash 
1 foss 
2 hack 


找 出 文件 中 重复 的 行 : 


$ sort unsorted.txt | uniq -da 
hack 


我 们 可 以 结合 -s 和 -w 来 指定 刍 : 


， 要 么 将 排 过 序 的 文件 作为 


“唯一 的 行 ” 是 指 来 自 输入 
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口 -s 指定 可 以 跳 过 前 n 个 字符 ; 
口 -w 指定 用 于 比较 的 最 大 字符 数 。 


这 个 对 比 键 被 用 作 unia 操 作 的 索引 : 











$ cat data.txt 
u:01:gnu 
d:04:1linux 
u:01:bash 
u:01l:hack 


我 们 需要 使 用 醒目 的 字符 作为 唯一 的 键 。 可 以 通过 忽略 前 2 个 字符 ( -s 2 ), 使 用 -w 选 项 ( -w 
2 ) 指定 用 于 比较 的 最 大 字符 数 。 


























$ sort data.txt | uniq -s 2 -w 2 

d:04:1linux 

u:01:bash 

我 们 将 命令 输出 作为 xargs 命 令 的 输入 时 ， 最 好 为 输出 的 各 行 添加 一 个 0 值 字 节 ( zero-byte ) 
终止 符 。 在 将 unia 命 令 的 输入 作为 xargs 的 数据 源 时 ， 同 样 应 当 如 此 。 如 果 没 有 使 用 0 值 字 节 终 
止 符 ， 那 么 在 默认 情况 下 ，xargs 命 令 会 用 空格 作为 定 界 符 分 割 参数 。 例 如 , 来自 stdain 的 文本 
行 “this is aline” 会 被 xargs 当 做 包含 4 个 不 同 的 参数 ,但 实际 上 它 只 是 一 个 单行 而 已 。 如 果 使 用 
0 值 字 节 终止 符 ， 那么 \0 就 被 作为 定 界 符 ， 此 时 ， 包 含 空格 的 单行 就 能 够 被 正确 地 解析 成 单个 
参数 。 


用 unig 命 令 生成 包含 0 值 字 节 终止 符 的 输出 : 

















$ uniq -z file.txt 
下 面 的 命令 将 删除 所 有 指定 的 文件 ， 这 些 文件 的 名 字 是 从 files.txt 中 读 取 的 : 
$ uniq -z file.txt | xargs -0 rm 


如 果 某 个 文件 名 在 文件 中 出 现 多 次 ，uniqg 命 令 只 会 将 这 个 文件 名 写 人 stdout 一 次 。 


2.10 ”临时 文件 命名 与 随机 数 


编写 shell 脚 本 时 ,我 们 经 常 需 要 存储 临时 数据 。 最 适合 存储 临时 数据 的 位 置 是 /tmp (该 目录 
中 的 内 容 在 系统 重启 后 会 被 清空 ) 有 两 种 方法 可 以 为 临时 数据 生成 标准 的 文件 名 。 




















2.10.1 实战 演练 
执行 下 列 步骤 来 创建 临时 文件 并 进行 不 同 的 命名 操作 。 
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(1) 创建 临时 文件 : 
$ filename= mktemp. 


$ echo $filename 
/tmp/tmp.8xvhkjFS5fH 


上 面 的 代码 创建 了 一 个 临时 文件 ， 并 打印 出 存储 在 $filename 中 的 文件 名 。 
(2) 创建 临时 目录 : 
$ dirname= mktemp -d. 


$ echo $dirname 
tmp .NI8xzW7VRX 


上 面 的 代码 创建 了 一 个 临时 目录 ， 并 打印 出 存储 在 $dirname 中 的 目录 名 。 
(3) 如 有 果 仅 仅 是 想 生 成 文件 名 ， 又 不 希望 创建 实际 的 文件 或 目录 ， 方 法 如 下 : 





$ tmpfile= “mktemp -u. 
$ echo $stmpfile 
/tmp/tmp.RsGmilRpcT 


文件 名 被 存储 在 $tmpfile 中 ， 但 并 没有 创建 对 应 的 文件 。 
(4) 根据 模板 创建 临时 文件 名 : 


$smktemp test .XxXx 
test.2tc 





2.10.2 ”工作 原理 


mktemp 命 令 的 用 法 非常 简单 。 它 生成 一 个 临时 文件 并 返回 其 文件 名 ( 如 果 创 建 的 是 目录 ， 
则 返回 目录 名 )。 


如 果 提 供 了 定制 模板 ，x 会 被 随机 的 字符 ( 字母 或 数字 ) 替换 。 注 意 , mktemp 正 常 工 作 的 前 
提 是 保证 模板 中 只 少 要 有 3 个 x。 

















2.11 分 割 文件 和 数据 


在 某 些 情况 下 ， 必 须 把 文件 分 割 成 多 个 更 小 的 片段 。 早 期 像 软 盘 之 类 的 设备 容量 都 很 有 限 ， 
将 文件 分 割 得 更 小 些 ， 以 便 能 够 存储 到 多 张 磁盘 中 就 显得 至 关 重 要 了 。 不 过 如 今 我 们 分 割 文 件 就 
是 出 于 其 他 目的 了 ， 比 如 为 提高 可 读 性 、 生 成 日 志 、 通 过 E-mail 发 送 文件 等 。 在 这 则 攻略 中 我 们 
会 看 到 将 文件 分 割 成 不 同 大 小 的 多 种 方法 。 
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2.11.1 工作 原理 


假设 有 一 个 叫做 data.file 的 测试 文件 ， 其 大 小 为 100KB。 你 可 以 将 该 文件 分 割 成 多 个 大 小 为 
10KB 的 文件 ， 方 法 如 下 : 





$ split -b 10k data.file 

$ 1s 

data.file xaa Xab xac xad xae xaf xag xah xai xaj 
上 面 的 命令 将 data.file 分 割 成 多 个 文件 ， 每 一 个 文件 大 小 为 10KB。 这 些 文件 以 xab、xac、xagd 的 
形式 命名 。 这 表明 它们 都 有 一 个 字母 后 缀 。 如 果 想 以 数字 为 后 级 ， 可 以 另外 使 用 -sa 参数 。 此 外 ， 
使 用 -a length 可 以 指定 后 级 长 度 : 








$ split -b 10k data.file -d -a 4 
除了 k (KB ) 后 级 ， 我 们 还 可 以 使 用 Mm (MB )、G ( GB )、c (byte )、w ( word ) 等 后 级 。 


$ 1s 
data.file x0009 x#0019 x#0029 x0039 x0049 x0059 x#0069 x#0079 


2.11.2 ”补充 内 容 


来 看 看 split 命 令 的 其 他 选项 。 





为 分 割 后 的 文件 指定 文件 名 前 缀 
之 前 那些 分 割 后 的 文件 都 有 一 个 文件 名 前 级 x。 我 们 也 可 以 通过 提供 一 个 前 级 名 来 使 用 自己 
的 文件 名 前 级 。split 命 令 最 后 一 个 参数 是 PREFIX， 其 格式 如 下 : 











$ split [COMMAND ARGS] PREFIX 


我 们 加 上 文件 名 前 级 再 运行 先前 那个 命令 来 分 割 文件 : 




















$ split -b 10k data.file -d -a 4 split file 

$ 1s 

data.file split file0002 split file0005 split file0008 strtok.c 
split file0000 split file0003 split file0006 split file0009 

split file0001 split file0004 split file0007 


如 果 不 想 按 照 数 据 块 大 小 , 而 是 需要 根据 行 数 来 分 割 文件 的 话 , 可 以 使 用 -1 no_of_lines: 





$ split -1 10 data.file 
# 分 割 成 多 个 文件 ， 每 个 文件 包含 10 行 


男 一 个 有 趣 的 的 工具 是 csplit。 它 能 够 依据 指定 的 条 件 和 字符 串 匹 配 选项 对 日 志文 件 进行 
分 割 。 来 看 看 这 个 工具 是 如 何 运 作 的 。 
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csplit 是 split 工 具 的 一 个 变 体 。split 只 能 够 根据 数据 大 小 或 行 数 分 割 文件 ， 而 csplit 
可 以 根据 文本 自身 的 特点 进行 分 割 。 是 否 存在 某 个 单词 或 文本 内 容 都 可 作为 分 割 文件 的 条 件 。 


看 一 个 日 志文 件 示例 : 




















$ cat server.log 
SERVER-1 
[connection] 192.168.0. 
[connection] 192.168.0. 
[disconnect] 192.168 
[connection] 192.168.0. 
SERVER-2 

[connection] 192.168.0. 
[connection] 192.168.0. 
[disconnect] 192.168.0. 
[connection] 192.168 
SERVER-3 

[connection] 192.168 
[connection] 192.168.0. 
[disconnect] 192.168.0. 
[connection] 192.168. 


success 
failed 
pending 


. 

Ooopo 
. 

DP 


success 


failed 
failed 
success 
failed 


. 
口 口 口 口 
. 

DP 


pending 
pending 
pending 


1 
2 
3 
4 failed 


. 
Oooo 
. 


我 们 需要 将 这 个 日 志文 件 分 制 成 serverl.log 、server2.log 和 server3.log， 这 些 文件 的 内 容 分 别 
取 自 原文 件 中 不 同 的 SERVER 部 分 。 那 么 ， 可 以 使 用 下 面 的 方法 来 实现 : 





ji 和 Esc 2 be © . ? . 
$ csplit server.log /SERVER/ -n 2 -s {*} E server -b "%02d.1log" rm server00.1log 


$ 1s 
Server01.l]og server02.log server03.log server.log 


有 关 这 个 命令 的 详细 说 明 如 下 。 


口 /SERVER/ 用 来 匹配 某 一 行 ， 分 割 过 程 即 从 此 处 开始 。 

口 / [REGEX] / 表示 文本 样式 。 包 括 从 当前 行 〈 第 一 行 ) 直到 (但 不 包括 ) 包含 “SERVER” 
的 匹配 行 。 

口 {*} 表示 根据 匹配 重复 执行 分 割 , 直到 文件 未 尾 为 止 。 可 以 用 { 整 数 } 的 形式 来 指定 分 割 执 
行 的 次 数 。 

-s 使 命令 进入 静默 模式 ， 不 打印 其 他 信息 。 

-n 指定 分 割 后 的 文件 名 后 缀 的 数字 个 数 ， 例 如 01、02、03 等 。 

-E 指定 分 割 后 的 文件 名 前 级 (在 上 面 的 例子 中 ，server 就 是 前 级 )。 

-b 指定 后 级 格式 。 例 如 %02a.1og， 类 似 于 C 语 言 中 printf 的 参数 格式 。 在 这 里 文件 名 = 


前 缀 + 后 缀 =server + %02d.1log。 


因为 分 割 后 的 第 一 个 文件 没有 任何 内 容 〈 匹 配 的 单词 就 位 于 文件 的 第 一 行 中 )， 所 以 我 们 删 
除了 server00.log。 
































DOCD 
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2.12 ”根据 扩展 名 切 分 文件 名 





有 一 些 脚 本 是 依据 文件 名 进行 各 种 处 理 的 。 我 们 可 能 会 需要 在 保留 扩展 名 的 同时 修改 文件 





名 、 转 换文 件 格 式 (保留 文件 名 的 同时 修改 扩展 名 ) 或 提取 部 分 文件 名 。shell 所 具有 的 一 些 内 建 
功能 可 以 依据 不 同 的 情况 来 切 分 文件 名 。 


2.12.1 ”实战 演练 





缘 助 操作 符 可 以 轻松 将 名 称 部 分 从 “名 称 .扩展 名 ”这 种 格式 中 提取 出 来 。 你 可 以 按照 下 面 


的 方法 从 sample.jpg 中 提取 名 称 。 


file_ jpg="sample.jpg" 
name=$ {file_ jpg%.*} 
echo File name is: Sname 


输出 结果 : 





File name is: sample 


下 一 个 任务 是 将 文件 名 的 扩展 名 部 分 提取 出 来 ， 这 可 以 借助 # 操作 符 实现 。 
提取 文件 名 中 的 .jpg 并 存储 到 变量 file_jpg 中 : 


extension=${file_ jpg#*.} 





echo Extension is: jpg 


输出 结果 : 





Extension is: jpg 


2.12.2 ”工作 原理 


在 第 一 个 任务 中 ， 为 了 从 “名 称 .扩展 名 ”这 种 格式 中 提取 名 称 ， 我 们 使 用 了 sg 操 作 符 。 


$ {VARS .*} 的 含义 如 下 所 述 : 


























口 从 svAR 中 删除 位 于 % 右 侧 的 通配符 (在 前 例 中 是 .* ) 所 匹配 的 字符 串 。 通 配 符 从 右 向 左 
进行 匹配 。 

口 给 VAR 赋 值 ，VAR=sample.jpg。 那 么 ,通配符 从 右 向 左 就 会 匹配 到 .jpg， 因 此 ， 从 $VAR 
中 删除 匹配 结果 ， 就 会 得 到 输出 sample。 


g% 属 于 非 贪 焚 ( non-greedy ) 操作 。 它 从 右 到 左 找 出 匹配 通 配 符 的 最 短 结果 。 还 有 男 一 个 操作 









































符 %%， 这 个 操作 符 与 $ 相 似 ， 但 行为 模式 却 是 贪 焚 的 ， 这 意味 着 它 会 匹配 符合 条 件 的 最 长 的 字符 
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串 。 例 如 ， 我 们 现在 有 这 样 一 个 文件 : 
VAR=hack .fun.book.txt 


使 用 % 操 作 符 : 





$ echo ${VAR%.*} 





得 到 输出 : hack. fun.book 
操作 符 $ 使 用 .* 从 右 向 左 执行 非 贪 林 匹 配 ( .txt )。 
使 用 %% 操 作 符 : 
$ echo ${VAR%%.*} 


得 到 输出 : hack 
操作 符 8% 则 用 .* 从 右 向 左 执 行 贪 栖 匹配 ( . fun .book.txt )。 


在 第 二 个 任务 中 ,我 们 用 # 操作 符 从 文件 名 中 提取 扩展 名 。 这 个 操作 符 与 类 似 ， 不 过 求 值 
方向 是 从 左 向 右 。 


$ {VAR#*.} 的 含义 如 下 所 述 : 


从 SVAR 中 删除 位 于 # 右 侧 的 通配符 ( 即 在 前 例 中 使 用 的 *. ) 所 匹配 的 字符 串 。 通 配 
符 从 左 向 右 进行 匹配 。 


和 sg% 类 似 ，# 也 有 一 个 相对 应 的 贪 焚 操 作 符 ##。 





## 从 左 向 右 进行 贪 林 匹配 ， 并 从 指定 变量 中 删除 匹配 结果 。 
来 看 一 个 例子 : 








VAR=hack. fun.book.txt 


使 用 # 操 作 符 : 





$ echo ${VAR#*.} 
得 到 输出 :fun .book. txt 

操作 符 # 用 * .从 左 向 右 执 行 非 贪 焚 匹配 (hack )。 
使 用 ## 操 作 符 : 





$ echo S${VAR##*.} 


得 到 和 输出: txt 
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操作 符 ## 则 用 * .从 左 向 右 执行 贪 焚 匹 配 ( txt )。 


因为 文件 名 中 可 能 包含 多 个 '.' 字 符 , 所 以 相 较 于 #, ## 更 适合 于 从 文件 名 中 
一 ”提取 扩展 名 。## 执行 的 是 贪 柳 匹 配 ， 因 而 总 是 能 够 准确 地 提取 出 扩展 名 。 


这 里 有 个 能 够 提取 域名 不 同 部 分 的 实用 案例 。 假 定 URL= "www.google.com'" : 


$ echo ${URL%.*} # 移 除 .* 所 匹配 的 最 右边 的 内 容 


www.google 


$ echo ${URL%%.*} # 将 从 右边 开始 一 直 匹 配 到 最 左边 的 * . 移 除 ( 贪 禁 操作 符 ) 


WwW 


$ echo ${URL#*.} # 移 除 * 。 所 匹配 的 最 左边 的 内 容 


google .com 


$ echo ${URL##*.} # 将 从 左边 开始 一 直 匹 配 到 最 右边 的 * . 移 除 ( 贪 禁 操作 符 ) 


com 


2.13 ”批量 重 命名 和 移动 


重 命名 多 个 文件 是 我 们 经 常会 碰 到 的 一 项 工作 。 举 个 简单 的 例子 ， 当 你 把 照片 从 数码 相机 传 
输 到 你 的 计算 机 之 后 , 你 可 能 会 删除 其 中 某 些 不 如 意 的 部 分 , 这 会 使 图 像 文件 的 编号 变 得 不 再 连 
续 。 你 会 想 使 用 特定 的 前 级 和 连续 的 数字 对 它们 进行 重 命名 。 我们 当然 可 以 借助 第 三 方 软件 执行 
这 类 重 命名 操作 ， 但 是 也 可 以 使 用 Bash 命 令 在 短 短 几 秒 钟 之 内 完成 同样 的 活 儿 。 


男 一 件 经 常 要 做 的 工作 是 , 将 文件 名 中 包含 某 个 特定 部 分 ( 例如 相同 的 前 缀 ) 或 者 具有 特定 
类 型 的 所 有 文件 移动 到 指定 的 文件 夹 中 。 让 我 们 看 看 如 何 用 脚本 来 执行 这 些 操作 。 















































2.13.1 预备 知识 


rename 俞 令 利 用 Perl 下 则 表达 式 修改 文件 名 。 综 合 运 用 find、rename 和 mv， 我 们 能 做 到 的 
事 其 实 很 多 。 





2.13.2 ”实战 演练 








用 特定 的 格式 重 命名 当前 目录 下 的 图 像 文件 ， 最 简单 的 方法 是 使 用 下 面 的 脚本 : 
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#!/bin/bash 
# 文 件 名 : rename.sh 
# 用 途 : 重 命名 .jpg 和 .png 文件 


count=1; 
for img in ‘find . -iname '*.png' -o -iname '*.jpg' -type f -maxdepth 1、 
do 

new=image-$count.s${img##*.} 


echo "Renaming Simg to S$new" 


mv 中 Ss img ul ul Ssnew nn 
let count++ 


done 

输出 如 下 : 

$ ./rename.sh 

Renaming hack.jpg to image-1.jpg 


Renaming new.jpg to image-2.jpg 
Renaming next .png to image-3.png 


该 脚本 将 当前 目录 下 所 有 的 .jpg 和 .png 文 件 重 命 名 ， 新 文件 名 的 格式 为 Image-1.jpg、 
image-2.jpg、image-3.jpg 、image-4.png 等 ， 依 次 类 推 。 


2.13.3 工作 原理 


在 前 面 的 重 命 名 脚本 中 , 使 用 了 for 循 环 对 所 有 扩展 名 为 jpg 或 .png 的 文件 进行 迭代 。 我 们 使 
用 find 命 令 进行 搜索 ， 选 项 -o 用 于 指定 多 个 -iname 选 项 ,后 者 用 于 执行 大 小 写 无 关 的 匹配 。 借 
助 -maxdepth 1, 确保 $img 中 只 包含 来 自 当前 目录 的 文件 名 ， 无视 其 他 的 子 目录 。 


为 了 跟踪 图 像 编 号 , 我 们 初始 化 变量 count=1。 下 一 步 就 是 用 mv 命令 重 命名 文件 。 因 此 需要 
构造 出 新 的 文件 名 。s$ {img##*.} 对 处 于 当前 循环 中 的 文件 名 进行 解析 并 获得 文件 扩展 名 ( 请 参 
看 2.12 节 中 对 于 s{img##x .) 的 解释 )。 


let count++ 用 来 在 每 次 循环 中 增加 文件 编号 。 
还 有 许多 其 他 执行 重 命名 操作 的 方法 ， 来 看 其 中 一 些 例子 。 


口 将 *.JPG 更 名 为 * .jpg: 


























$ rename *.JPG *.jpg 
口 将 文件 名 中 的 空格 蔡 换 成 字符 “_”: 


$ rename 's/ /_/g' * 
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沪 














's/ /_/g' 用 于 替换 文件 名 ,而 * 是 用 于 匹配 目标 文件 的 通配符 ， 它 也 可 以 以 * .txt 或 
其 他 样式 出 现 。 


口 转换 文件 名 的 大 小 写 : 





$ rename 'y/A-Z/a-z/' * 
$ rename 'y/a-z/A-Z/' * 


口 将 所 有 的 .mp3 文 件 移入 给 定 的 目录 : 
$ find path -type f -name "*.mp3" -exec mv {} target dir \; 
口 将 所 有 文件 名 中 的 空格 蔡 换 为 字符 “_”: 


$ find path -type f -exec rename 's/ /_/g' {} \; 


2.14 ”拼写 检查 与 词典 操作 


Linux 大 多 数 发 行 版 都 含有 一 份 词典 文件 。 然 而 ， 我 发 现 几乎 没 和 人 在意 过 这 个 文件 ， 更 别提 
利用 它 了 。 还 有 一 个 叫做 aspel1 的 命令 行 工具 ， 其 作用 是 进行 拼写 检查 。 让 我 们 通过 一 些 脚本 
来 看 看 如 何 使 用 词典 文件 和 拼写 检查 工具 。 














2.14.1 ”实战 演练 
目录 /hsr/share/dict/ 包含 了 一 些 词典 文件 “词典 文件 ”就 是 包含 了 词典 单词 列表 的 文本 文件 。 
我 们 可 以 利用 这 个 列表 来 检查 某 个 单词 是 否 为 词典 中 的 单词 。 


$ ls /usr/share/dict/ 
american-english british-english 


为 了 检查 给 定 的 单词 是 否 为 词典 中 的 单词 ， 可 以 使 用 下 面 的 脚本 : 


#!/bin/bash 
# 文 件 名 : checkword.sh 





word=$1 
grep "^$1$" /usr/share/dict/british-english -q 
if [ $? -eq 0 ]; then 


echo Sword is a dictionary word; 
else 

echo Sword is not a dictionary word; 
下 3: 


这 个 脚本 的 用 法 如 下 : 


$ ./checkword.sh ful 
ful is not a dictionary word 
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$ ./checkword .sh fool 
fool is a dictionary word 


2.14.2 ”工作 原理 
在 grep 中 ,“^ 标记 着 单词 的 开始 ，$ 标记 着 单词 的 结束 。 
-q 禁止 产生 任何 输出 。 
另外， 我 们 也 可 以 用 拼写 检查 命令 aspell 来 核查 某 个 单词 是 否 在 词典 中 : 











#!/bin/bash 
# 文 件 名 : aspellcheck.sh 
word=$1 


output= echo \"$word\" | aspell list. 


if [ -z $output ]; then 
echo Sword is a dictionary word; 


echo Sword is not a dictionary word; 
下 半 


当 给 定 的 输入 不 是 一 个 词典 单词 时 ，aspell 1ist 命 令 产 生 输 出 文本 ， 反 之 则 不 产生 任何 
输出 。-z 用 于 确认 soutput 是 否 为 空 。 


列 出 文件 中 以 特定 单词 起 头 的 所 有 单词 : 


$ look word filepath 


或 者 使 用 








$ grep "^word" filepath 





在 默认 情况 下 ， 如 果 没 有 给 出 文件 参数 ，1ook 命 令 会 使 用 默认 词典 ( /usr/share/dict/words ) 
并 返回 输出 。 

$1o0ok word 

# 像 这 样 使 用 时 ，1ook 命 令 以 默认 词典 作为 文件 参数 
例如 : 


$ look android 
android 
android's 
androids 





2.15 ”交互 输入 自动 化 


就 编写 自动 化 工具 或 测试 工具 而 言 ， 实 现 命令 的 交互 输入 自动 化 极其 重要 。 在 很 多 情况 下 ， 
我 们 要 同一 些 以 交互 方式 读 取 输入 的 命令 打交道 。 下面 的 例子 就 是 一 个 要 求 提供 交互 式 输入 的 命 
令 执 行 过 程 。 























$ command 

Enter a number: 1 

Enter name : hello 

You have entered 1,hello 


2.15.1 预备 知识 


能 够 自动 接受 输入 的 自动 化 工具 , 对 于 本 地 命令 或 远程 应 用 来 说 都 有 益处 。 让 我 们 看 看 如 何 
实现 自动 化 。 





2.15.2 ”实战 演练 
思考 一 下 交互 式 输入 的 过 程 。 参 照 之 前 的 代码 ， 我 们 可 以 将 涉及 的 步骤 描述 如 下 : 
1l[Return]hello[Return] 


观察 实际 通过 键盘 输入 的 字符 ， 可 以 将 上 面 的 1、Return、hello 以 及 Return 转 换 为 以 下 





"1l\nhello\n" 
按 下 回 车 键 时 会 发 送 \n。 通 过 添加 \a， 就 可 以 得 到 发 送 给 stain 的 字符 串 。 
因此 ， 通 过 发 送 与 用 户 输入 等 同 的 字符 串 ， 我 们 就 可 以 实现 在 交互 过 程 中 自动 发 送 输入 。 











2.15.3 ”工作 原理 
先 写 一 个 读 取 交互 式 输入 的 脚本 ， 然 后 用 这 个 脚本 进行 自动 化 的 演示 : 
#!/bin/bash 


# 文 件 名 : interactive.sh 
read -p "Enter number:" no ;} 





read -p "Enter name:" name 
echo You have entered Sno， Sname; 


按照 下 面 的 方法 向 脚本 自动 发 送 输入 : 
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$ echo -e "1l\nhello\n" | ./interactive.sh 
You have entered 1, hello 


看 来 制作 的 输入 生效 了 。 


我 们 用 echo -e 来 生成 输入 序列 ，-e 表 明 echo 会 解释 转 义 序列 。 如 果 输 入 内 容 比 较 多 ， 那 
么 可 以 用 单独 的 输入 文件 结合 重 定 向 操作 符 来 提供 输入 : 

$ echo -e "1l\nhello\n" > input.data 

$ cat input.data 


1 
hello 


制作 输入 文件 时 ， 你 也 可 以 不 用 echo 命 令 : 





$ ./interactive.sh < input.data 
这 个 方法 是 从 文件 中 导入 交互 式 输 入 数据 。 


如 果 你 是 逆向 工程 师 , 那 可 能 同 缓冲 区 溢出 攻击 打 过 交道 。 要 实施 攻击 ,我 们 需要 将 十 六 进 
制 形式 的 shellcode (例如 “\xepb\xla\x5e\x31\xc0\x88\x46”) 进行 重 定向 。 这 些 字符 没 
法 直接 通过 键盘 输入 ， 因 为 键盘 上 并 没有 其 对 应 的 按键 。 因 此 ， 我 们 应 该 使 用 : 























echo -e \xeb\xla\xS5e\x31\xc0\x88\x46" 
这 条 命令 会 将 shellcode 重 定向 到 有 缺陷 的 可 执行 文件 中 。 


我 们 已 经 描述 了 一 种 方法 ,， 它 通过 stain 将 所 需 的 文本 进行 重 定向 ， 从 而 实现 交互 式 输入 程 
序 自动 化 。 但 是 我 们 并 没有 检查 所 发 送 的 输入 内 容 。 我 们 期 望 程序 以 特定 (固定 ) 的 次 序 处 理 我 
们 所 发 送 的 输入 。 如 果 程 序 对 于 输入 采取 随机 或 其 他 处 理 次 序 ， 或 者 甚至 不 要 求 输入 某 些 内 容 ， 
那么 之 前 的 方法 就 要 出 问题 了 。 它 会 发 送 不 符合 程序 要 求 的 错误 输入 。 为 了 处 理 动态 输入 并 通 ; 
检查 程序 运行 时 的 输入 需求 来 提供 输入 内 容 , 我 们 要 使 用 一 个 出 色 的 工具 expect。expect 命 4 
可 以 根据 输入 要 求 提 供 适 合 的 输入 。 











ei 











沪 忆 





2.15.4 补充 内 容 

我 们 看 看 expect 的 用 法 。 交 互 式 输入 自动 化 也 可 以 用 其 他 方法 实现 。expect 脚 本 就 是 其 中 
之 一 Oo 

用 expect 实 现 自动 化 

在 默认 情况 下 ， 多数 常见 的 Linux 发 行 版 中 并 不 包含 expect。 你 得 用 软件 包 管 理 器 手动 进行 


Ee a a 
安装 。 
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expect 等 待 特定 的 输入 提示 ， 通 过 检查 输入 提示 来 发 送 数据 。 


#!/usr/bin/expect 

# 文 件 名 : automate_expect.sh 
spawn ./interactive.sh 
expect "Enter number:" 
send "1\n" 





expect "Enter name:" 
send "hello\n" 
expect eof 


运行 结果 如 下 : 





$ ./automate expect.sh 
在 这 个 脚本 中 : 


口 spawn 参 数 指定 需要 自动 化 哪 一 个 命令 ; 
口 expect 参 数 提供 需要 等 待 的 消息 ; 
口 send 是 要 发 送 的 消息 ; 


D expect eof 指明 命令 交互 结束 。 





2.16 利用 并 行进 程 加 速 命令 执行 
在 过 去 的 几 年 中 , 计算 能 力 有 了 大 幅度 的 攀升 。 但 这 并 不 是 仅仅 因为 处 理 器 有 了 更 高 的 时 钟 
频率 , 而 是 因为 多 核 的 出 现 。 对 于 用 户 而 言 , 这 意味 着 单个 物理 处 理 絮 中 包含 了 多 个 逻辑 处 理 器 。 


除非 软件 能 够 善 加 利用 多 核 , 否则 它们 毫 无 用 武之 地 。 如 果 你 有 一 个 需要 进行 大 量 运 算 的 程 
序 ， 仅 运行 在 其 中 一 个 核心 上 , 那么 其 他 的 核心 都 会 被 闲置 。 如 果 想 提高 速度 ， 软 件 必须 留意 并 
充分 利用 多 核 。 


在 这 则 攻略 中 ， 我 们 会 看 到 如 何 让 命令 运行 得 更 快 。 











2.16.1 ”实战 演练 


以 之 前 讲 过 的 ma5sum 命 令 为 例 。 由 于 涉及 运算 ， 该 命令 属于 CPU 密集 型 
件 需要 生成 校 验 和 ， 我 们 可 以 使 用 下 面 的 脚本 来 运行 mda5sum 的 多 个 实例 。 





一 





命令 。 如 果 多 个 文 





#/bin/bash 

# 文 件 名 : generate_checksums.sh 
PIDARRAY= () 

for file in Filel.iso File2.iso 
do 


md5sum S$file & 
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PIDARRAY+=("$!") 
done 
wait S${PIDARRAY[@]} 


运行 脚本 后 ， 可 以 得 到 如 下 输出 : 





$ ./generate checksums.sh 
330dcb53£f253acdf76431lcecca0fefe7 Filel.iso 
bdi694a6fe6df12c3b8141dcffaf06e6 File2.iso 


输出 结果 和 下 面 命令 的 结果 一 样 : 











md5sum Filel.iso File2.iso 


但 是 因为 多 个 mda5sum 命 令 是 同时 运行 的 ， 如 果 你 使 用 的 是 多 核 处 理 器 ， 就 会 更 快 地 获得 运行 
果 (可 以 使 用 Fime 命 令 来 验证 )。 




















2.16.2 ”工作 原理 


我 们 利用 了 Bash 的 操作 符 &， 它 使 得 shell 将 命令 置 于 后 台 并 继续 执行 脚本 。 这 意味 着 一 旦 循 
结束 ， 脚 本 就 会 退出 ， 而 mda5sum 命 令 仍 在 后 台 运行 。 为 了 避免 这 种 情况 ， 我 们 使 用 $:! 来 获得 
进程 的 PID， 在 Bash 中 ，$! 保 存 着 最 近 一 个 后 台 进 程 的 PID。 我 们 将 这 些 PID 放 入 数组 ,然后 使 用 

wait 命 令 等 待 这 些 进程 结 
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本 章 内 容 

口 生成 任意 大 小 的 文件 口 生成 ISO 文件 及 混合 ISO 

口 文本 文件 的 交集 与 差 集 口 查找 文件 差异 并 进行 修补 

口 查找 并 删除 重复 文件 口 head 与 tail 一 一 打印 文件 的 前 10 行 或 
口 文件 权限 、 所 有 权 和 粘 滞 位 后 10 行 

口 创建 不 可 修改 文件 口 只 列 出 目录 的 其 他 方法 

口 批量 生成 空白 文件 口 在 命令 行 中 用 pusha 和 popd 快 速 定 位 
口 查找 符号 链接 及 其 指向 目标 口 统计 文件 的 行 数 、 单 词 数 和 字符 数 

口 列举 文件 类 型 统计 信息 口 打印 目录 树 

口 使 用 环 回 文件 


3.1 简介 


Unix 将 操作 系统 中 的 一 切 都 视 为 文件 。 所 有 操作 都 离 不 开 文件 ,可 以 利用 它们 进行 各 种 与 系 
统 或 进程 相关 的 处 理工 作 。 例 如 , 我 们 所 使 用 的 命令 终端 就 是 和 一 个 设备 文件 关联 在 一 起 的 。 我 
们 可 以 通过 写 和 特定 终端 所 对 应 的 设备 文件 来 实现 向 终端 写 和 信息。 文件 的 形式 多 种 多 样 ， 比 如 
目录 、 普 通 文件 、 块 设备 、 字 符 设 备 、 符 号 链接 、 套 接 字 和 命名 管道 等 。 文 件 名 、 大 小 、 文 件 类 
型 、 文 件 内 容 修 改 时 间 、 文 件 访问 时 间 、 文 件 属性 更 改 时 间 、i 节 点 、 链 接 以 及 文件 所 在 的 文件 
系统 等 都 是 文件 的 属性 。 本 章 包含 的 实战 攻略 涉及 文件 相关 的 操作 及 属性 。 


















































3.2 生成 任意 大 小 的 文件 


出 于 各 种 原因 , 你 也 许 需 要 生成 一 个 包含 随机 数据 的 文件 。 这 可 能 是 用 于 执行 测试 的 测试 文 
件 ， 比 如 用 一 个 大 文件 作为 输入 来 测试 应 用 程序 的 效率 ; 也 可 能 是 测试 文件 分 割 , 或 是 创建 环 回 
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文件 系统 ( 环 回 文件 自身 包含 文件 系统 ， 这 种 文件 可 以 像 物理 设备 一 样 使 用 mount 命 令 进行 挂 
载 )。 专门 写 一 个 程序 来 创建 这 些 文件 可 得 花 点 功夫 ， 所 以 我 们 用 一 些 通用 工具 帮忙 解决 。 








实战 演练 

创建 特定 大 小 的 大 文件 最 简单 的 方法 就 是 利用 agd 命 令 。agd 命 令 会 克隆 给 定 的 输入 内 容 ， 然 
后 将 一 模 一 样 的 一 份 副本 写 入 到 输出 。stain、 设 备 文件 、 普 通 文件 等 都 可 作为 输入 ，stdout、 
设备 文件 、 普 通 文件 等 也 可 作为 输出 。 下 面 是 使 用 aa 命令 的 一 个 示例 : 





























$ dd if=/dev/zero of=junk.data bs=1M count=1 

1+0 records in 

1+0 records out 

1048576 bytes (1.0 MB) copied, 0.00767266 s, 137 MB/s 


该 命令 会 创建 一 个 LIMB 大 小 的 文件 junk.data。 来 看 一 下 命令 参数 : if 代表 输入 文件 (input file )， 
of 代表 输出 文件 ( output file )，bs 代 表 以 字 节 为 单位 的 块 大 小 (block size )，count 代 表 需 要 被 
复制 的 块 数 。 


使 用 dq 命令 时 一 定 得 留意 ， 该 命令 运行 在 设备 底层 。 要 是 你 不 小 心 出 了 仿 
子 ， 杭 不 好 会 把 磁盘 清空 或 是 损坏 数据 。 所 以 一 定 要 反复 检查 dd 命令 所 用 的 语 
法 是 否 正确 ， 尤 其 是 参数 of=。 


在 上 面 的 例子 中 ,我 们 将 bs 指定 为 I1MB，count 指 定 为 1!1， 于 是 得 到 了 一 个 大 小 为 1MB 的 文 
件 。 如 果 把 bs 设 为 2MB，count 设 为 2， 那么 总 文件 大 小 就 是 4MB。 


块 大 小 可 以 使 用 各 种 计量 单位 。 表 3-1 中 任意 一 个 字符 都 可 以 置 于 数字 之 后 来 指定 字 节 数 。 





表 3-1 

单元 大 小 代 码 
字 节 ( 1B) 
字 (2B) 
块 (512B ) 
千 字 节 ( 1024B ) 
兆 字 节 ( 1024KB ) 
吉 字 节 ( 1024MB ) 





O 


人 总 员 吕 


按照 这 种 方法 ， 我 们 就 可 以 生成 任意 大 小 的 文件 。 表 3-1 中 给 出 的 计量 单位 都 可 以 使 用 。 


/dev/zero 是 一 个 字符 设备 ， 它 会 不 断 返回 0 值 字 节 〈\0 )。 
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如 果 不 指 定 输入 参数 (if )， 默 认 情 况 下 aq 会 从 stain 中 读 取 和 输入。 与 之 类 似 ， 如 果 不 指 定 
输出 参数 ( of )， 则 aq 会 将 stdaout 作 为 默认 输出 。 


也 可 以 用 aq 命令 传输 大 量 数据 并 观察 命令 输出 来 测量 内 存 的 操作 速度 ( 例如 , 在 前 一 个 例子 
中 所 示 的 1048576 bytes (1.0 MB) copied, 0.00767266 s，137 MB/s )。 
3.3 ”文本 文件 的 交集 与 差 集 


交集 (intersection ) 和 差 集 ( set difference ) 操作 在 数学 课 上 的 集合 论 中 经 常会 被 用 到 。 不 过 ， 
有 时 候 对 字符 串 进 行 类 似 的 操作 也 很 有 用 。 





3.3.1 预备 知识 
comm 命 令 可 用 于 两 个 文件 之 间 的 比较 。 它 有 很 多 不 错 的 选项 可 用 来 调整 输出 ， 以 便 我 们 执 
行 交 集 、 求 差 ( difference ) 以 及 差 集 操作 ”。 
口 交集 : 打印 出 两 个 文件 所 共有 的 行 。 
口 求 差 : 打印 出 指定 文件 所 包含 的 且 互 不 相同 的 那些 行 。 
口 差 集 : 打印 出 包含 在 文件 A 中 ， 但 不 包含 在 其 他 指定 文件 中 的 那些 行 。 














3.3.2 ”实战 演练 
需要 注意 的 是 comm 必 须 使 用 排 过 序 的 文件 作为 输入 。 请 看 看 下 面 的 例子 : 





$ cat A.txt 
apple 
orange 
gold 
silver 
steel 

iron 


$ cat B.txt 
orange 
gold 
cookies 
carrot 





Qa 假设 现在 有 两 个 文件 A 和 B， 内 容 分 别 是 : A(1,2,3)，B(3,4,5)。 那 么 ， 对 这 两 个 文件 进行 操作 的 结果 如 下 。 
交集 : 3。 
求 差 : 1,2,4,5。 
差 集 (A): 1,2。 
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$ sort A.txt -o A.txt ; sort B.txt -o B.txt 


(1) 首先 执行 不 带 任 何 选项 的 comm: 


$ comm A.txt B.txt 
apple 
carrot 
cookies 
gold 
iron 
orange 


silver 

steel 

输出 的 第 一 列 包 含 只 在 A.txt 中 出 现 的 行 ， 第 二 列 包 含 只 在 B.txt 中 出 现 的 行 ， 第 三 列 
包含 A.txt 和 B.txt 中 相同 的 行 。 各 列 以 制 表 符 〈\t ) 作为 定 界 符 。 











(2) 为 了 打印 两 个 文件 的 交集 ， 我 们 需要 删除 第 一 列 和 第 二 列 ， 只 打印 出 第 三 列 : 


$ comm 和 有 .txt B.txt -1 -2 
gold 
orange 


(3) 打印 出 两 个 文件 中 不 相同 的 行 : 


$ comm A.txt B.txt -3 


apple 
carrot 
cookies 
iron 
silver 
steel 


在 这 次 的 输出 中 ， 那 些 唯 一 出 现 的 行使 得 列 中 出 现 了 空白 字段 。 所 以 这 两 列 在 同一 
行 上 不 会 同时 都 出 现 内 容 。 为 了 提高 输出 结果 的 可 用 性 ， 需 要 删除 空白 字段 ， 将 两 
列 合 并 成 一 列 : 





apple 
Carrot 
cookies 
iron 
silver 
steel 





(4) 要 生成 规范 的 输出 ， 得 使 用 下 面 的 命令 : 


$ comm A.txt B.txt -3 | sed 's/^\t//' 
apple 
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carrot 
cookies 
iron 
silver 
steel 


(5) 通过 删除 不 需要 的 列 ， 我 们 就 可 以 分 别 得 到 A.txt 和 B.txt 的 差 集 。 
口 A.txt 的 差 集 
$ comm A.txt B.txt -2 -3 
-2 -3 删除 第 二 列 和 第 三 列 。 
口 B.txt 的 差 集 








$ comm A.txt B.txt -1 -3 


-1 -3 删除 第 一 列 和 第 三 列 。 








3.3.3 工作 原理 
comm 的 命令 行 选项 可 以 按照 需求 对 输出 进行 格式 化 ， 例 如 : 


口 -1 从 输出 中 删除 第 一 列 ; 
口 -2 从 输出 中 删除 第 二 列 ; 
D -3 从 输出 中 删除 第 三 列 。 

在 生成 统一 输出 时 ，seq 命 令 通 过 管道 获取 comm 的 输出 。 它 删除 行 首 的 \t 字 符 。seqa 中 的 s 
表示 替换 ( substitute )。/^\t/ 匹配 行 前 的 \t (“是 行 首 标记 )。// (两 个 /操作 符 之 间 没 有 任何 
字符 ) 是 用 来 蔡 换 行 首 的 \t 的 字符 串 。 如 此 一 来 ， 就 删除 了 所 有 行 首 的 \t。 


差 集 操作 允许 你 比较 两 个 文件 , 打印 出 只 在 A.txt 或 B.txt 中 出 现 的 行 。 当 A.txt 和 B.txt 作 为 comm 
命令 的 参数 时 ， 输 出 中 的 第 一 列 是 A.txt 相 对 于 B.txt 的 差 集 ， 第 二 列 是 B.txt 相 对 于 A.txt 的 差 集 。 
































3.4 ”查找 并 删除 重复 文件 


重复 文件 是 同一 个 文件 的 多 个 副本 。 有 时 候 我 们 需要 删除 重复 的 文件 ， 只 保留 其 中 一 份 。 通 
过 查看 文件 内 容 来 识别 重复 文件 是 件 挺 有 意思 的 活 儿 。 可 以 结合 多 种 shell 工 具 来 完成 这 项 任务 。 
在 这 则 攻略 中 ， 我 们 讨论 如 何 查找 重复 文件 并 根据 查找 结果 执行 相关 的 操作 。 











3.4.1 预备 知识 
我 们 可 以 通过 比较 文件 内 容 来 识别 它们 。 校 验 和 是 依据 文件 内 容 来 计算 的 , 内 容 相 同 的 文件 
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自然 会 生成 相同 的 校 验 和 ， 因 此 ， 我 们 可 以 通过 比较 校 验 和 来 删除 重复 文件 。 











3.4.2 ”实战 演练 
(1) 按照 下 面 的 方法 创建 一 些 测 试 文件 : 





$ echo "hello" > test ; cp test test copyl ; cp test test copy2; 
$ echo "next" > other; 
# test_copyl 和 test_copy2 都 是 test 文 件 的 副本 


(2) 删除 重复 文件 的 脚本 代码 如 下 : 


# !/bin/bash 
# 文件 名 : remove_duplicates.sh 
# 用 途 : 查找 并 删除 重复 文件 ， 每 一 个 文件 只 保留 一 份 








ls -1S --time-style=long-iso | awk 'BEGIN { 
getline; getline; 
namel=$8; size=$5 


name2=$8; 
if (size==$5) 
{ 
"md5sum "namel | getline; csuml=$1; 
"md5sum "name2 | getline; csum2=$1; 
if ( csuml==csum2 ) 
{ 
print namel; print name2 
} 
}3 


size=$5; namel=name2; 
}' | sort -u > duplicate_ files 


cat duplicate_ files | xargs -I {} md5sum {} | sort | uniq -w 32 | awk '{ print 
"ns2"$" }' | sort -u > duplicate_ sample 


echo Removing.. 


comm quplicate_files duplicate sample -2 -3 | tee /dev/stderr | xargs rm 
echo Removed duplicates files successfully. 


(3) 执行 方式 : 


$ ./remove duplicates.sh 
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3.4.3 工作 原理 


前 文中 的 shell 脚 本 会 找 出 茶 个 目录 中 同一 文件 的 所 有 副本 , 然后 保留 单个 副本 的 同时 删除 其 
他 副本 。 让 我 们 研究 一 下 这 个 脚本 的 工作 原理 。 


1s -1S 对 当前 目录 下 的 所 有 文件 按照 文件 大 小 进行 排序 ， 并 列 出 文件 的 详细 信息 。awk 读 取 
ls -1Ss 的 输出 ， 对 行列 进行 比较 ， 找 出 重复 文件 。 


下 面 是 代码 的 执行 逻辑 。 


口 我 们 将 文件 依据 大 小 排序 并 列 出 ， 这 样 大 小 接近 的 文件 就 会 排列 在 一 起 。 识 别 大 小 相同 
的 文件 是 我 们 查找 重复 文件 的 第 一 步 。 接 下 来 ， 计 算 这 些 文件 的 校 验 和 。 如 果 校 验 和 相 
同 ， 那 么 这 些 文件 就 是 重复 文件 ， 将 被 删除 。 

在 从 文件 中 读 取 文本 行 之 前 , 首先 要 执行 awk 的 BEGIN{} 语 句 块 。 读 取 文 本 行 的 工作 在 {) 
语句 块 中 进行 ， 读 取 并 处 理 完 所 有 的 行 之 后 ， 执 行 END{} 语 句 块 。1s -1s 的 输出 如 下 : 
total 16 

-rw-r--r-- 1 slynux slynux 5 2010-06-29 11:50 other 

-rw-r--r-- 1 slynux slynux 6 2010-06-29 11:50 test 


-rw-r--r-- 1 slynux slynux 6 2010-06-29 11:50 test_ copyl 
-rw-r--r-- 1 slynux slynux 6 2010-06-29 11:50 test_ copy2 


D 第 1 行 输出 告诉 我 们 文件 数量 ， 这 个 信息 在 本 例 中 没什么 用 处 。 我 们 用 get1ine 读 取 第 1 
行 , 然后 丢弃 。 由 于 需要 对 每 一 行 及 其 下 一 行 来 比 对 文件 大 小 ， 因 此 用 get1ine 读 取 长 
文件 列表 的 第 一 行 ， 并 存储 文件 名 和 大 小 ( 它们 分 别 是 第 8 列 和 第 5 列 )。 这 样 我 们 就 先 得 
到 了 一 行 。 接 下 来 ，awk 进 入 {} 语 句 块 (在 这 个 语句 块 中 读 取 余 下 的 文本 行 )， 读 取 到 的 
每 一 行文 本 都 会 执行 该 语句 块 。 它 将 当前 行 中 读 取 到 的 文件 大 小 与 之 前 存储 在 变量 size 
中 的 值 进行 比较 。 如 果 相 等 ， 那 就 意味 着 两 个 文件 至 少 在 大 小 上 是 相同 的 ， 随 后 再 用 
ma5sum 执 行进 一 步 的 检查 。 


我 们 在 给 出 的 解决 方法 中 使 用 了 一 些 技巧 。 
在 awk 中 ， 外 部 命令 的 输出 可 以 用 下 面 的 方法 读 取 : 











口 




















"cmd"| getline 


随后 就 可 以 在 $0 中 获取 命令 的 输出 , 在 $1,$2,…sn 中 获取 命令 输出 中 的 每 一 列 。 我们 将 文件 
的 md5sum 保 存在 变量 csuml 和 csum2 中 。 变 量 namel 和 name2 保 存 文件 列表 中 位 置 连续 的 文件 
名 。 如 果 两 个 文件 的 校 验 和 相同 ， 那 它们 肯定 是 重复 文件 ， 其 文件 名 会 被 打印 出 来 。 


我 们 需要 从 每 组 重复 文件 中 找 出 一 个 文件 ， 这 样 就 可 以 删除 其 他 副本 了 。 计 算 重 复 文件 的 
md5sum， 从 每 一 组 重复 文件 中 打印 出 其 中 一 个 。 这 是 通过 -w 32 比 较 每 一 行 的 ma5sum ( md5sum 
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输出 中 的 前 32 个 字符 , ma5sum 的 输出 通常 由 32 个 字符 的 散 列 值 和 文件 名 组 成 ), 然后 找 出 那些 不 
相同 的 行 。 这 样 ， 每 组 重复 文件 中 的 一 个 采样 就 被 写 和 duplicate_sample。 


现在 需要 将 auplicate_files 中 列 出 的 、 且 未 包含 在 auplicate_sample 之 内 的 全 部 文件 
删除 。 这 些 文件 由 comm 命 令 负责 打印 出 来 。 我 们 可 以 使 用 差 集 操 作 来 实现 (参考 3.3 节 )。 


comm 通 常 只 接受 排序 过 的 文件 。 所 以 , 在 重 定向 到 duplicate_files 和 duplicate_sample 
之 前 ， 首 先 用 sort -u 作 为 一 个 过 滤 句 。 


tee 命 令 在 这 里 有 一 个 妙用 : 它 在 将 文件 名 传递 给 rm 命令 的 同时 ， 也 起 到 了 print 的 作用 。 
tee 将 来 自 stdin 的 行 写 和 文件， 同时 将 其 发 送 到 staqout。 我 们 也 可 以 将 文本 重 定 问 到 stqderr 
来 实现 终端 打印 功能 。/dev/stderr 是 对 应 于 stderr ( 标准 错误 ) 的 设备 。 通 过 重 定向 到 stderr 
设备 文件 ， 来自 stain 的 文本 将 会 以 标准 错误 的 形式 出 现在 终端 中 。 
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文件 权限 和 所 有 权 是 Unix/Linux 文 件 系 统 ( 如 ext 文 件 系统 ) 最 显著 的 特性 之 一 ,在 Unix/Linux 
平台 工作 时 , 经 常会 碰 到 与 文件 权限 及 所 有 权 相 关 的 问题 。 这 则 攻略 就 考查 了 文件 权限 和 所 有 权 
的 各 种 用 例 。 


Linux 系 统 中 的 每 一 个 文件 都 与 多 种 类 型 的 权限 相关 联 。 在 这 些 权 限 中 ， 我 们 通常 要 和 三 类 
权限 打交道 ( 用户、 用 户 组 以 及 其 他 用 户 )。 


用 户 (user ) 是 文件 的 所 有 者 。 用 户 组 ( group ) 是 多 个 用 户 的 集合 ( 由 系统 管理 员 指 定 )， 
系统 允许 这 些 用 户 对 文件 进行 某 种 形式 的 访问 。 其 他 用 户 ( others ) 是 除 文 件 用 户 或 用 户 组 之 外 
的 任何 人 。 


用 命令 1s -1 可 以 列 出 文件 的 权限 : 


























-rw-r--r-- 1 slynux slynux 2497 2010-02-28 11:22 bot .py 
drwxr-xr-x 2 slynux slynux 4096 2010-05-27 14:31 a.py 
-rw-r--r-- 1 slynux slynux 539 2010-02-10 09:11 cl.pl 


第 1 列 输出 明确 了 后 面 的 输出 。 其 中 第 一 个 字母 的 对 应 关系 如 下 所 示 。 











口 -一 一 普通 文件 。 
口 一 一 目录 。 
Dc 字符 设备 。 
口 b 一 一 块 设备 。 
口 1 一 一 符号 链接 。 
Ds 套 接 字 。 
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口 p 一 一 管道 。 


剩 下 的 部 分 可 以 划分 成 三 组 ， 每 组 3 个 字符 )。 第 一 组 的 3 个 字符 ( -一 ) 对 应 
用 户 权限 ( 所 有 者 )， 第 二 组 对 应 用 户 组 权限 ， 第 三 组 对 应 其 他 用 户 权限 。 这 9 个 字符 〈 即 9 个 权 
限 ) 中 的 每 一 个 字符 指明 是 否 其 设置 了 某 种 权限 。 如 果 已 设置 ， 对 应 位 置 上 会 出 现 一 个 字符 ， 否 
则 出 现 一 个 '-'， 表 明 没 有 设置 对 应 的 权限 。 


让 我 们 来 看 一 下 每 个 字符 组 对 于 用 户 、 用 户 组 以 及 其 他 用 户 的 含义 。 


口 用 户 〈 权 限 序列 : rwx------ ): 第 一 个 字符 指定 用 户 是 否 拥有 文件 的 读 权限 。 如 果 为 用 
户 设置 了 读 权限 , r 将 出 现在 第 一 个 字符 的 位 置 上 ,第 二 个 字符 指定 了 写 ( 修改 ) 权 限 ( w )， 
第 三 个 字符 指定 了 用 户 是 否 拥 有 执行 权限 ( x， 即 运 行 该 文件 的 权限 )。 可 执行 文件 通常 
会 设置 执行 权限 。 用 户 还 有 一 个 称 为 setuia(s ) 的 特殊 权限 ， 它 出 现在 执行 权限 (x ) 
的 位 置 。setuid 权 限 允 许 用 户 以 其 拥有 者 的 权限 来 执行 可 执行 文件 ， 即 使 这 个 可 执行 文 
件 是 由 其 他 用 户 运 行 的 。 
































具有 setuigd 权 限 的 文件 的 权限 序列 如 下 : -rws------ 
目录 同样 也 有 读 、 写 、 执 行 权 限 。 不 过 对 于 目录 来 说 , 读 、 写 、 执 行 权 限 的 含义 有 点 不 
一 样 : 


a 目录 的 读 权限 (= ) 允许 读 取 目录 中 文件 和 子 目录 的 列表 ; 
m 日 录 的 写 权 限 (w) 允许 在 目录 中 创建 或 删除 文件 或 目录 ; 
a 目录 的 执行 权限 (x) 指明 是 否 可 以 访问 目录 中 的 文件 和 子 目 录 。 


口 用 户 组 〈 权 限 序列 : ---rwx---): 第 二 组 字符 指定 了 组 权限 。 组 权限 的 rwx 的 含义 和 用 
户 权限 中 的 一 样 。 组 权限 并 没有 setuid, 但 是 有 一 个 setgia (s) 位 。 它 允许 以 同 该 目 
录 拥 有 者 所 在 组 相同 的 有 效 组 权限 来 允许 可 执行 文件 。 但 是 这 个 组 和 实际 发 起 命令 的 用 
































户 组 未 必 相 同 。 
组 权限 的 权限 序列 如 下 : ----rws---。 
口 其 他 用 户 ( 权 限 序列 : ------ rwx): 最 后 三 个 字符 是 其 他 用 户 权限 。 和 用 户 以 及 用 户 组 


一 样 ， 其 他 用 户 也 有 读 、 写 、 执 行 权限 ,但 是 并 没有 s 权 限 ( 如 setuid 和 setgid )。 
目录 有 一 个 特殊 的 权限 ， 叫 做 粘 灌 位 (sticky bit )。 如 果 目 录 设置 了 烙 滞 位 ， 只 有 创建 该 目 
录 的 用 户 才能 如 除 目录 中 的 文件 ， 即 使 用 户 组 和 其 他 用 户 也 有 写 权限 ,也 无 能 无 力 。 烙 渍 位 出 现 
在 其 他 用 户 权 限 中 的 执行 权限 (x ) 位 置 。 它 使 用 t 或 来 表示 。 如 有 果 没 有 设置 执行 权限 ,但 设置 
了 烙 洱 位 ， 就 使 用 t; 如 果 同 时 设置 了 执行 权限 和 烙 滞 位 ， 就 使 用 T。 
例如 : 
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设置 目录 粘 滞 位 的 一 个 典型 例子 就 是 /tmp。 








在 ls -1 的 每 一 行 输出 中 ， 字 符 串 slynux slynux 分 别 对 应 所 属 用 户 和 所 属 用 户 组 。 第 一 





个 slynux 代 表 所 属 用 户 ， 第 二 个 slynux 代 表 用 户 组 的 所 有 者 。 


3.5.1 ”实战 演练 
可 使 用 chmog 命 令 设置 文件 权限 。 





假设 需要 设置 权限 : rwx rw- r--。 

可 以 像 下 面 这 样 使 用 chmoa: 

$ chmod u=rwx g=rw o=r filename 
在 这 里 : 


Du 
Dog 





指定 用 户 权限 
指定 用 户 组 权限 
指定 其 他 实体 权限 


可 以 对 用 户 、 用 户 组 和 其 他 用 户 用 + 进行 添加 权限 ， 用 - 删除 权限 。 
文件 已 经 具有 权限 rwx rw- r--， 现 在 需要 增加 可 执行 权限 ， 方 法 如 下 : 














$ chmod o+x filename 
给 所 有 权限 类 别 ( 即 用 户 、 用 户 组 和 其 他 用 户 ) 增加 可 执行 权限 : 
$ chmod a+x filename 
其 中 ，a 表 示 全 部 (all )。 
如 果 需 要 删除 权限 ， 则 使 用 -， 例 如 : 
$ chmod a-x filename 


也 可 以 用 八进制 数 来 设置 权限 。 权 限 由 3 位 八进制 数 来 表示 ， 每 一 位 按 顺 序 分 别 对 应 用 户 
组 和 其 他 用 户 。 


读 、 写 和 执行 权限 都 有 与 之 对 应 的 唯一 的 八进制 数 : 








Dr--=4 
DQ -w-=2 
口 --x=1 


周记 
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我 们 可 以 将 权限 序列 的 八进制 值 相 加 来 获得 所 需 的 权限 组 合 ， 例 如 : 


Drw-=4+2=6 
Dr-x=4+1=5 





权限 序列 rwx rw- r-- 的 数字 表示 形式 如 下 : 





Drwx=4+2+1=7 
Drw-=4+2=6 
Dr--= 4 


因此 ，rwx rw- r-- 等 于 764， 那么 使 用 八进制 值 设置 权限 的 命令 为 : 


$ chmod 764 filename 





3.5.2 ”补充 内 容 
让 我 们 再 看 一 些 其 他 有 关 文 件 和 目录 的 操作 。 
1. 更 改 所 有 权 
要 更 改 文件 的 所 有 权 ， 可 以 使 用 chown 命 令 : 
$ chown user.group filename 

例如 : 
$ chown slynux.slynux test.sh 

在 这 里 ，slynux 既 是 用 户 名 ， 也 是 用 户 组 名 。 


2. 设置 粘 滞 位 






































烙 灌 位 是 一 种 应 用 于 目录 的 权限 类 型 。 通过 设置 粘 沾 位 , 使 得 只 有 目录 的 所 有 者 才能 够 删除 
目录 中 的 文件 ， 即 使 用 户 组 和 其 他 用 户 拥 有 足够 的 权限 也 不 能 执行 删除 操作 。 


要 设置 粘 清 位 ， 利 用 chmoq 将 +t 应 用 于 目录 : 











$ chmod a+t directory name 

3. 以 递归 的 方式 设置 权限 

有 时 候 需要 以 递归 的 方式 修改 当前 目录 下 的 所 有 文件 和 子 目录 的 权限 ， 方 法 如 下 : 
$ chmod 777 . -BR 


选项 -R 指 定 以 递归 的 方式 修改 权限 。 
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我 们 用 “. ”指定 当前 工作 目录 ， 这 等 同 于 : 

$ chmod 777 "$ (pwd)" -R. 

4. 以 递归 的 方式 设置 所 有 权 

用 chown 命 令 结合 -R 就 可 以 以 递归 的 方式 设置 所 有 权 : 

$ chown user.group . -R 

5. 以 不 同 的 身份 运行 可 执行 文件 

一 些 可 执行 文件 需要 以 不 同 的 用 户 吴 份 (启动 该 文件 的 当前 用 户 之 外 的 用 户 )， 通 过 文件 路 
径 来 执行 (如 .executable name )。 有 一 个 叫做 setuig 的 特殊 文件 权限 ， 它 允许 其 他 用 户 以 文件 
所 有 者 的 身份 来 执行 文件 。 

首先 将 文件 的 所 有 权 蔡 换 为 需要 执行 该 文件 的 用 户 , 然后 以 该 用 户 的 身份 登录 。 运行 下 面 的 


命令 : 

















$ chmod +s executable file 


# chown root.root executable file 
# chmod +s executable file 
$ ./executable file 


现在 ， 这 个 文件 实际 上 每 次 都 是 以 root 用 户 的 身份 来 执行 。 


setuig 的 使 用 不 是 无 限制 的 。 为 了 确保 安全 ， 它 只 能 应 用 在 Linux ELF 格 式 二 进 制 文件 上 ， 
而 不 能 用 于 脚本 文件 。 








3.6 创建 不 可 修改 的 文件 


在 常见 的 Linux 扩 展 文件 系统 中 ( 如 ext2 、ext3 、ext4 等 )， 可 以 借助 某 种 文件 属性 将 文件 设置 
为 不 可 修改 (immutable )。 一 旦 设置 ， 任 何 用 户 〈 包 括 超级 用 户 ) 都 不 能 删除 该 文件 ， 除 非 其 不 
可 修改 的 属性 被 移 除 。 通 过 查看 /etc/mtab 文 件 ， 我 们 很 容易 获知 所 有 挂 载 分 区 的 文件 系统 类 型 。 
这 个 文件 的 第 一 列 指定 了 分 区 设备 路 径 ( 如 /dev/sda5 )， 第 三 列 指定 了 文件 系统 类 型 ( 如 ext3 )。 


不 可 修改 属性 是 避免 文件 被 算 改 的 安全 手段 之 一 。/etc/resolv.conf 文 件 就 是 这 样 的 一 个 例子 。 
该 文件 包含 了 一 组 DNS 服务 器 列表 。DNS 服 务 器 负责 将 域名 (例如 packtpub.com ) 转换 成 IP 地 址 。 
它 通 常 被 设置 成 你 所 属 ISP 的 DNS 服务 器 地 址 。 但 有 些 用 户 更 喜欢 使 用 第 三 方 的 DNS 服务 器 ， 他 
们 会 修改 /etcmresolv.conf， 将 其 指向 所 选 的 服务 器 。 可 当下 次 你 再 连接 到 ISP 时 ，/etc/resolvconf 又 
会 恢复 到 之 前 的 设置 。 为 了 避免 这 种 情况 ， 需 要 将 /etc/resolv.conf 设置 成 不 可 修改 。 
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3.6.1 预备 知识 
chattr 能 够 将 文件 设置 为 不 可 修改 。 不 过 chattr 能 做 的 可 不 止 这 些 





3.6.2 ”实战 演练 
(1) 使 用 下 列 命令 将 一 个 文件 设置 为 不 可 修改 : 
# chattr +i file 
(2) 这 样 文件 file 就 变 为 了 不 可 修改 状态 。 来 试 试 下 面 的 命令 


rm file 
rm: cannot remove 'file': Operation not permitted 


(3) 如 果 需 要 使 文件 恢复 可 写 状态 ， 移 除 不 可 修改 属性 即 可 : 








chattr -i file 


3.7 ”批量 生成 空白 文件 

有 了 时候 我 们 可 能 需要 为 程序 生成 测试 样本 , 这 些 程序 面 对 的 是 上 千 个 文件 。 那 该 怎样 生成 这 
些 测试 样本 呢 ? 
3.7.1 预备 知识 


touch 命 令 可 以 用 来 生成 空白 文件 或 是 修改 文件 的 时 间 戳 《如果 文件 已 存在 )。 让 我 们 来 看 
看 该 命令 的 用 法 - 





3.7.2 ”实战 演练 
(1) 用 下 面 的 命令 创建 一 个 名 为 filename 的 空白 文件 : 
$ touch filename 
(C) 批量 生成 不 同名 字 的 空白 文件 : 


for name jn {1..100}.txt 
do 

touch $name 
done 
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在 上 面 的 代码 中 ，{1. .100} 会 扩展 成 一 个 字符 串 “1, 2, 3, 4, 5, 6, 7，…100”。 除 了 
{1..100}.txt ， 我 们 还 可 以 使 用 其 他 简写 样式 ， 比 如 test{1..200}.c、 
test{a. .z} .txt 等 。 

如 果 文 件 已 经 存在 ， 那 么 couch 命 令 会 将 与 该 文件 相关 的 所 有 时 间 玲 都 更 改 为 当前 
时 间 。 如 果 我 们 只 想 更 改 某 些 时 间 戳 ， 则 可 以 使 用 下 面 的 选项 。 

口 touch -a 只 更 改 文 件 访问 时 间 。 

口 touch -m 只 更 改 文件 内 容 修改 时 间 。 


(3) 除了 将 时 间 惟 更 改 为 当前 时 间 ， 我 们 还 能 够 为 时 间 戳 指定 特定 的 时 间 和 日 期 : 

















$ touch -d "Fri Jun 25 20:50:14 IST 1999" filename 








-a 使 用 的 日 期 串 不 需要 是 同样 的 格式 。 它 可 以 接受 任何 简短 的 日 期 格式 。 我 们 可 以 
忽略 具体 时 间 ， 使 用 “Jan 20 2010” 这 种 方便 的 日 期 格式 。 


3.8 ”查找 符号 链接 及 其 指向 目标 


符号 链接 在 类 Unix 系 统 中 很 常见 。 使 用 它 的 理由 有 很 多 , 要 么 是 为 了 便于 存 取 , 要 么 是 为 了 
维护 相同 代码 库 或 程序 的 不 同 版 本 。 这 则 攻略 中 我 们 讨论 了 处 理 符 号 链接 的 一 些 基 本 方法 。 


























符号 链接 只 不 过 是 指向 其 他 文件 的 指针 。 它 在 功能 上 类 似 于 Mac OS 中 的 别名 或 Windows 中 的 
快捷 方式 。 删 除 符号 链接 不 会 影响 到 原始 文件 。 





3.8.1 实战 演练 
我 们 可 以 按照 下 面 的 步骤 来 处 理 符号 链接 。 

(1) 创建 符号 链接 : 
$ ln -s target symbolic link name 
例如 : 
$ ln -1 -s /var/www/ ~/web 
这 个 命令 在 已 登录 用 户 的 home 目 录 中 创建 了 一 个 名 为 Web 的 符号 链接 。 该 链接 指向 
/var/www。 

(2) 使 用 下 面 的 命令 来 验证 是 否 创建 链接 : 


$ 1s -1 web 
lrwxrwixrwx 1 slynux slynux 8 2010-06-25 21:34 web -> /var/www 
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web -> /var/www 表 明 web 指 向 /varwww。 

(3) 打印 出 当前 目录 下 的 符号 链接 : 
$ 1s -1 | grep "^1" 

(4) 使 用 fina 打 印 当 前 目录 以 及 子 目录 下 的 符号 链接 : 
$ find . -type 1 -print 

(5) 使 用 reag1link 打 印 出 符号 链接 所 指向 的 目标 路 径 : 


$ readlink web 
/var/www 


3.8.2 工作 原理 


在 查找 当前 目录 下 的 符号 链接 时 ，grep 对 1s -1 的 输出 进行 过 滤 ， 使 用 ^ 显 示 那 些 以 1 起 始 
的 行 ，^ 是 字符 串 的 起 始 标记 。 该 方法 利用 了 这 样 一 个 事实 : 每 个 符号 链接 的 权限 标记 块 
( lrwxrwxrwx ) 均 以 字母 1 起 始 。 

在 使 用 find 时 ,我 们 将 type 的 参数 指定 为 1， 告 诉 fingd 命 令 只 搜索 符号 链接 文件 。-print 
选项 将 符号 链接 列表 打印 到 标准 输出 (stdout )。“: ”表示 从 当前 目录 开始 搜索 。 


3.9 列举 文件 类 型 统计 信息 






































文件 类 型 可 谓 数量 繁多 。 如 果 编 写 一 个 脚本 , 使 它 能 够 遍历 目录 中 所 有 的 文件 ,并 生成 一 份 
关于 文件 类 型 细节 以 及 每 种 文件 类 型 数量 的 报告 , 这 肯定 很 有 意思 。 这 则 攻略 正 是 教 你 练习 如 何 
编写 一 个 能 够 遍历 大 量 文件 并 收集 相关 细节 的 脚本 。 








3.9.1 预备 知识 


find 命 令 可 以 通过 查看 文件 内 容 来 找 出 特定 类 型 的 文件 。 在 Unix/Linux 系 统 中 , 文件 类 型 并 
不 是 由 文件 扩展 名 决定 的 ( 在 微软 Windows 平 台中 是 这 么 做 的 )。 编 写 这 个 脚本 的 目的 是 从 多 个 
文件 中 收集 文件 类 型 统计 信息 。 我 们 用 关联 数组 存储 相同 类 型 的 文件 数量 ， 用 find 命 令 获取 每 
一 个 文件 的 类 型 细 方 。 
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3.9.2 ”实战 演练 
(1) 用 下 面 的 命令 打印 文件 类 型 信息 : 


$ file filename 
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$ file /etc/passwd 
/etc/passwd: ASCII text 


(2) 打印 不 包括 文件 名 在 内 的 文件 类 型 信息 : 


$ file -b filename 
ASCII text 


(3) 生成 文件 统计 信息 的 脚本 如 下 : 


# !/bin/bash 
# 文件 名 : filestat.sh 





if [ $# -ne 1 ]; 

then 
echo "Usage is $0 basepath"; 
exit 

主演 

path=$1 


declare -A statarray; 
while read line; 
do 
ftype= ` file -b "$line" | cut -d, -f1. 


let statarray["$ftype"]++; 


done < <(find $path -type f -print) 


echo ============ File types and counts ============= 
for ftype in "${!statarray[@]}"; 
do 
echo Sftype : S${statarray["sftype"]} 
done 
(4) 用 法 如 下 : 


$ ./filestat.sh /home/slynux/temp 
输出 如 下 : 


$ ./filetype.sh /home/slynux/programs 
============ File types and counts ============= 
Vim swap file : 1 

ELF 32-bit LSB executable : 6 

ASCII text : 2 

ASCII C program text : 10 
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3.9.3 工作 原理 


在 脚本 中 声明 了 一 个 关联 数组 statarray, 这 样 可 以 用 文件 类 型 作为 数组 索引 , 将 每 种 文件 
类 型 的 数量 存 人 数组 。 每 次 遇 到 一 个 文件 类 型 ， 就 用 let 增 加 计数 。finq 命 令 以 递归 的 方式 获取 
文件 路 径 列表 。 脚 本 中 的 ftype=' file -b "$line"' 使 用 file 命 令 获得 文件 类 型 信息 。 选 项 
-b 告 诉 file 命 令 只 打印 文件 类 型 (不 包括 文件 名 )。 输出 的 文件 类 型 信息 包含 很 多 细节 ， 比 如 图 
像 编 码 以 及 分 辩 率 ( 如 果 是 图 像 文 件 的 话 )。 对 于 这 些 细节 我 们 并 不 感 兴趣 ， 我 们 只 需要 基本 的 
言 息 就 够 了 。 各 种 细节 信息 是 由 逗号 分 隔 的 ， 例 如 : 






































$s file a.out -b 
ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), dynamically linked (uses 
shared libs), for GNU/Linux 2.6.15, not stripped 


我 们 只 需要 从 上 面 这 些 细节 中 提取 ELF 32-bit LSB executable。 因 此 我 们 使 用 cut -a,， 
-f1， 指 明 以 逗号 作为 定 界 符 ， 并且 只 打印 第 一 个 字段 。 


done<<(find $path -type f -print) ;是 一 段 很 重要 的 代码 。 它 的 执行 逻辑 如 下 : 








while read line; 
do something 
done < filename 


我 们 不 用 filename， 而 是 用 fingd 命 令 的 输出 。 
<(find $path -type f -print) 等 同 于 文件 名 。 只 不 过 它 用 子 进程 输出 来 代替 文件 名 。 


注意 ,第 一 个 < 用 于 输入 重 定 向 ,第 二 个 < 用 于 将 子 进程 的 输出 装 换 成 文件 名 。 在 两 个 < 之 间 有 一 
个 空格 ,避免 shell 将 其 解释 为 << 操 作 符 。 











; 在 Bash 3.x 及 更 高 的 版 本 中 ， 有 一 个 新 操作 符 <<<， 可 以 让 我 们 将 字符 囊 作 
~ 为 输入 文件 。 利 用 这 个 新 操作 符 ， 可 以 将 loop 循 环 的 done 语 句 改写 成 


done <<< "‘find $path -type f -print " 


s{!statarray[@]} 用 于 返回 一 个 数组 索引 列表 。 


3.10 ”使 用 环 回 文件 


环 回 (loopback ) 文件 系统 是 Linux 类 系统 中 非常 有 趣 的 部 分 。 我 们 通常 是 在 设备 上 ( 例如 磁 
盘 分 区 ) 创建 文件 系统 。 这 些 存 储 设备 能 够 以 设备 文件 的 形式 来 使 用 ， 比 如 /dev/device_name。 
为 了 使 用 存储 设备 上 的 文件 系统 ， 我 们 需要 将 其 挂 载 到 一 些 被 称 为 挂 载 点 ( mount point ) 的 目录 
上 。 环 回 文件 系统 是 指 那些 在 文件 中 而 非 物理 设备 中 创建 的 文件 系统 。 我 们 可 以 将 这 些 文件 作为 
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文件 系统 挂 载 到 挂 载 点 上 。 这 实际 上 可 以 让 我 们 在 物理 磁盘 上 的 文件 中 创建 逻辑 磁盘 。 


3.10.1 实战 演练 
让 我 们 来 看 看 如 何在 大 小 为 1GB 的 文件 中 创建 ext4 文 件 系 统 。 
(1) 下 面 的 命令 可 以 创建 一 个 1GB 大 小 的 文件 : 








$ dq if=/dev/zero of=loobackfile.img bs=1G count=1 
1024+0 records in 

1024+0 records out 

1073741824 bytes (1.1 GB) copied, 37.3155 s, 28.8 MB/s 


你 会 发 现 创 建 好 的 文件 大 小 超过 了 1GB。 这 是 因为 硬盘 作为 块 设备 ， 其 分 配 存 储 空 
间 时 是 按照 块 大 小 的 整数 倍 来 进行 的 。 


(2) 用 mkfs 命 令 将 1GB 的 文件 格式 化 成 ext4 文 件 系统 : 




















$ mkfs.ext4 loopbackfile.img 
(3) 使 用 下 面 的 命令 检查 文件 系统 


$ file loobackfile.img 
loobackfile.img: Linux rev 1.0 ext4 filesystem data, 
UUID=c9d56c42-f8e6-4cbd-aeab-369d5056660a (extents) (large files) (huge files) 


(4) 现在 就 可 以 挂 载 环 回 文件 了 : 


# mkdir /mnt/loopback 
# mount -oO loop loopbackfile.img /mnt/loopback 


-o loop 用 来 挂 载 环 回 文件 系统 。 


这 实际 上 是 一 种 快捷 的 挂 载 方法 ， 我 们 无 需 手 动 连接 任何 设备 。 但 是 在 内 部 ， 这 个 
环 回 文件 连接 到 了 一 个 名 为 /dewloop1 或 1oop2 的 设备 上 。 


(5) 我 们 也 可 以 手动 来 操作 : 


# losetup /dev/loopl loopbackfile.img 
# mount /dev/loopl /mnt/loopback 


(6) 使 用 下 面 的 方法 进行 卸载 ( umount ): 



































# umount mount point 
例如 : 


# umount /mnt/loopback 
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(7) 也 可 以 用 设备 文件 的 路 径 作 为 umount 命 令 的 参数 : 





# umount /dev/loopl 


| 注意 ， 因 为 mount 和 umount 都 是 特权 命令 ， 所 以 必须 以 root 用 户 的 身份 来 | 
~> 执行 。 


3.10.2 ”工作 原理 


我 们 首先 使 用 aa 命令 创建 了 一 个 文件 ， 准 备 将 其 作为 环 回 文件 使 用 。dq 是 一 个 用 于 复制 原 
始 数据 (raw data ) 的 通用 命令 。 它 将 数据 从 if 参数 所 指定 的 文件 复制 到 of 参数 所 指定 的 文件 中 。 
另外 ,我 们 指定 ad 以 大 小 为 1GB 的 块 为 单位 进行 复制 ， 共 复制 1 块 ， 这 样 就 创建 了 一 个 1GB 的 文 
件 。/dev/zero 是 一 个 特殊 的 文件 ， 如 果 读 取 这 个 文件 ， 读 出 的 内 容 都 是 0。 

然后 使 用 mkfts . ext4 命 令 在 该 文件 中 创建 ext4 文 件 系统 。 我 们 需要 文件 系统 才能 将 文件 存 
储 到 磁盘 或 环 回 文 件 中 。 

最 后 , 我 们 使 用 mount 命 令 将 环 回 文件 挂 载 到 挂 载 点 上 (在 这 个 例子 中 是 /mnt/loopback )。 挂 
载 点 使 得 用 户 可 以 访问 文件 系统 中 的 文件 。 在 执行 mount 命令 之 前 ， 应 该 先 使 用 mkqir 命 令 创 建 
挂 载 点 。 选 项 -o loop 用 于 指明 使 用 的 是 环 回 文件 。 

当 mount 知 道 它 使 用 的 是 环 回 文件 时 ， 它 会 自动 在 /dev 中 建立 一 个 对 应 该 环 回 文件 的 设备 并 
进行 挂 载 。 如 果 想 手动 操作 ， 可 以 使 用 losetup 命 令 建 立 设备 ， 然 后 使 用 mount 命 令 挂 载 。 



























































3.10.3 ”补充 内 容 
让 我 们 再 来 研究 一 下 使 用 环 回 文件 和 挂 载 的 其 他 用 法 。 
1. 在 环 回 镜像 中 创建 分 区 


假设 我 们 需要 创建 环 回 文件 , 然后 分 区 并 挂 载 其 中 某 个 分 区 。 在 这 种 情况 下 , 没 法 使 用 mount 
-o loop。 我 们 必须 手动 建立 设备 并 挂 载 分 区 。 使 用 下 面 的 方法 对 文件 ( 内 容 全 部 填充 为 0 ) 进 
行 分 区 : 











# losetup /dev/loopl loopback.img 
# fdisk /dev/loopl 


。 fqdisk 是 Linux 系 统 中 的 标准 分 区 工具 , 在 http://www.tldp.org/HOWTO/Partition/ 
fdisk_ partitoning.html 处 可 以 找到 一 份 有 关 如 何 使 用 fdisk 创 建 分 区 的 简明 教程 
( 记得 将 教程 中 的 /dev/hdb 换 成 /dev/loop1 )。 
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在 loopback.img 中 创建 分 区 并 挂 载 第 一 个 分 区 : 








# losetup -o 32256 /dev/loop2 loopback.img 
/dev/loop2 表 示 第 一 个 分 区 ，-o 用 来 指定 偏 移 量 ，32 256 字 节 用 于 DOS 分 区 方案 "。 第 一 个 分 区 
在 硬盘 上 起 始 于 32 256 字 节 处 。 

2. 快速 挂 载 带 有 分 区 的 换 回 磁盘 镜像 

如 果 我 们 希望 挂 载 环 回 磁盘 镜像 中 的 分 区 ， 可 以 将 分 区 偏 移 量 以 手动 的 形式 传递 给 
losetup。 不过， 有 一 个 更 快 的 方法 可 以 挂 载 镜 像 中 的 所 有 分 区 一 一 kpartx。 它 并 没有 安装 默 
认 在 系统 中 ， 你 得 使 用 软件 包 管 理 咒 进行 安装 : 

















# kpartx -V -a diskimage.img 

add map loop0pl1 (252:0): 0 114688 linear /dev/loop0 8192 

add map loop0p2 (252:1): 0 15628288 linear /dev/loop0 122880 
这 条 命令 在 磁盘 镜像 中 的 分 区 与 /dev/mapper 中 的 设备 之 间 建 立 了 映射 ， 随 后 便 可 以 挂 载 这 些 设 
备 。 下 列 命令 可 以 用 来 挂 载 第 一 个 分 区 : 








# mount /dev/mapper/loop0pl /mnt/diskl1 


当 你 处 理 完 该 设备 上 的 操作 后 ( 使 用 umount 印 载 所 有 挂 载 过 的 分 区 ), 使 用 下 列 命令 移 除 映 
射 关 系 : 











# kpartx -Q diskimage .img 
loop deleted : /dev/loop0 


3. 将 ISO 文 件 作 为 环 回 文件 挂 载 


ISO 文件 是 光学 存储 介质 的 归档 。 我 们 可 以 采用 挂 载 环 回 文件 的 方法 ， 像 挂 载 物理 光盘 一 样 
挂 载 I SO 文件 。 


我 们 甚至 可 以 用 一 个 非 空 目录 作为 挂 载 路 径 。 那么 在 设备 被 扼 载 之 前 , 这 个 挂 载 路 径 中 包含 
的 都 是 来 自 该 设备 的 数据 ， 而 非 目 录 中 的 原始 内 容 。 例 如 : 


# mkdir /mnt/iso 
# mount -o loop linux.iso /mnt/iso 


现在 就 可 以 用 /mnt/iso 中 的 文件 进行 操作 了 。ISO 是 一 个 只 读 文件 系统 。 
4. 使 用 sync 即 刻 应 用 更 改 
当 对 挂 载 设备 作出 更 改 之 后 , 这 些 改变 并 不 会 被 立即 写 人 物理 设备 。 只 有 当 绥 冲 区 被 写 满 之 
























































@ losetup 中 的 -o 32256 (512*63=32256) 用 于 设置 数据 偏 移 。 由 于 历史 原因 ， 硬 盘 第 一 个 扇 区 ( 512 字 节 ) 作 
为 MBR ( Master Boot Record， 主 引导 记录 )， 其 后 的 62 个 扇 区 作为 保留 扇 区 。 
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3.11 生成 1SO 文件 及 混合 型 ISO 


ISO 镜像 是 一 种 存档 格式 , 它 存储 了 如 CD-ROM、DVD-ROM 等 光盘 的 精确 镜像 。ISO 镜 像 通 
常用 于 存储 待 刻 录 的 数据 。 这 节 ， 我 们 会 看 到 如 何 使 用 光盘 来 创建 ISO 镜像 。 很 多 人 都 是 依赖 第 
三 方 工具 来 创建 ISO 镜像 。 其 实 若 使 用 命令 行 ， 会 更 简单 。 

我 们 同样 需要 区 分 可 引导 光盘 与 不 可 引导 光盘 之 间 的 差别 。 可 引导 光盘 自身 具备 引导 能 
也 可 以 运行 操作 系统 或 其 他 软件 。 不 可 引导 光盘 则 做 不 到 这 些 。 很 重要 的 一 点 是 : 将 可 引导 光盘 
中 的 内 容 复制 到 另 一 张 光 盘 上 并 不 足以 生成 一 张 新 的 可 引导 光盘 。 要 想 保 留 光 盘 的 可 引导 性 , 应 
该 使 用 ISO 文件 将 其 保存 为 磁盘 镜像 。 

现在 ， 多 数 人 会 用 闪存 或 硬盘 作为 光盘 的 代替 品 。 当 我 们 将 一 个 可 引导 的 ISO 文件 写 人 闪存 
后 ， 它 却 再 也 没 法 引导 了 ， 除 非 我 们 使 用 一 种 专门 设计 用 于 闪存 设备 的 混合 ISO 镜像 。 


这 则 攻略 将 带 你 认识 ISO 镜像 及 其 处 理 方 法 。 
































3.11.1 预备 知识 


我 们 已 经 提 到 过 多 次 ，Unix 将 一 切 都 作为 文件 来 处 理 。 所 有 的 设备 都 是 文件 。 那 应 该 怎样 复 
制 设备 的 精确 镜像 呢 ” 需要 读 出 所 有 的 数据 ， 并 将 其 写 和 人 另外 一 个 文件 ， 对 吧 ? 


如 我 们 所 知 ，cat 命 令 可 以 用 来 读 取 任何 数据 ， 重 定向 可 以 用 来 写 入 文件 。 


























3.11.2 ”实战 演练 
用 下 面 的 命令 从 /dewcdrom 创 建 一 个 ISO 镜像 ; 


# cat /dev/cdrom > image.iso 


尽管 可 以 奏效 。 但 创建 ISO 镜像 最 好 的 方法 还 是 使 用 aa 工具 : 





# dd if=/dev/cdrom of=image .iso 


mkisofs 命 令 用 于 创建 ISO 文 件 系统 ,可 以 用 cdrecord 之 类 的 工具 将 mkisofs 的 输出 文件 直 
接 刻 录 到 CD-ROM 或 DVD-ROM 上。 我 们 可 以 将 需要 的 所 有 文件 放 入 同一 个 目录 中 ， 然 后 用 
mkisofs 将 整个 目录 的 内 容 写 和 人 一 个 ISO 文件 。 方 法 如 下 : 








$ mkisofs -V "Label" -o image.iso source dir/ 
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其 中 选项 -o 指 定 了 ISO 文件 的 路 径 。source_dqir 是 作为 ISO 文件 内 容 来 源 的 目录 路 径 ， 选 项 -Vv 
指定 了 ISO 文件 的 卷 标 。 
3.11.3 ”补充 内 容 

让 我 们 继续 学 习 一 些 ISO 文 件 相 关 的 命令 和 技巧 。 

1. 能 够 启动 闪存 或 硬盘 的 混合 型 ISO 


通常 无 法 通过 将 可 引导 的 ISO 文件 写 人 USB 设 备 来 启动 操作 系统 。 但 是 有 一 种 被 称 为 “混合 
ISO” 的 特殊 ISO 文件 可 以 做 到 这 一 切 。 



































我 们 可 以 用 isohybria 命 令 把 标准 ISO 文件 转换 成 混合 ISO。isohybrid 是 一 个 比较 新 的 工具 ， 
大 多 数 的 Linux 发 行 版 中 还 未 包含 这 个 工具 。 你 可 以 从 http:/syslinux.zytorcom 下 载 syslinux 软 件 包 。 


来 看 看 下 面 的 命令 : 
# isohybrid image.iso 
执行 这 个 命令 ， 我 们 将 获得 一 个 名 为 image.iso 的 混合 ISO， 它 可 用 于 写 人 USB 存 储 设备 。 
将 该 ISO 写 和 人 USB 存 储 设备 : 
# dd if=image.iso of=/dev/sdbl 


你 可 以 用 适当 的 设备 代替 /devwsdb1， 或 者 使 用 cat 命 令 : 





# cat image.iso >> /dev/sdbl 
2. 用 命令 行 刻录 ISO 
cdrecorgd 命 令 可 以 用 来 将 ISO 文 件 刻 人 CD-ROM 或 DVD-ROM。 刻 录 CD-ROM 的 方法 如 下 : 
# cdrecord -v dev=/dev/cdrom image.iso 
还 有 一 些 其 他 的 选项 ， 如 下 所 示 : 
口 我 们 可 以 用 -speed 选 项 指定 刻录 速度 : 
-speed SPEED 
例如 : 
# cdrecord -Vv dev=/dev/cdrom image.iso -speed 8 
参数 8 表明 其 刻录 速度 为 8x。 
口 刻录 CD-ROM 时 也 可 以 采用 多 区 段 ( multisession ) 方式 ， 这 样 就 能 在 一 张 光盘 上 分 多 次 
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刻录 数据 。 多 区 段 刻录 需要 使 用 -multi 选 项 : 
# cdrecord -v dev=/dev/cdrom image.iso -multi 
3. 玩 转 CD-ROM 托 盘 
如 果 你 是 用 的 是 桌面 电脑 ， 不 妨 试 试 下 面 的 命令 来 找 点 乐趣 。 

















Ds eject 


这 个 命令 可 以 弹出 光驱 托盘 。 














Ds eject -t 
这 个 命令 可 以 合 上 光驱 托盘 。 
不 妨 试 着 写 一 个 可 以 让 托盘 重复 开 合 n 次 的 循环 吧 。 


3.12 ”查找 文件 差异 并 进行 修补 


当 一 个 文件 有 多 个 版 本 时 , 如 果 能 够 重点 标记 出 这 些 版 本 之 间 的 不 同 而 无 须 通 过 人 工 查 看 来 
比较 ,， 那 就 简直 是 太 棒 了 。 要 是 文件 很 大 ， 光 靠 人 工 进行 比较 可 是 件 极其 费时 费力 的 活 儿 。 这 则 
攻略 为 你 演示 如 何 用 行 号 对 文件 之 间 的 差异 进行 重点 标记 。 当 多 名 开发 人 员 在 文件 繁多 的 环境 下 
工作 时 ， 如 果菜 个 人 对 其 中 某 个 文件 进行 了 修改 ， 那 么 应 该 将 这 个 修改 告知 其 他 所 有 开发 人 员 。 
如 果 发 送 整 个 源 代码 ， 不 仅 浪费 磁盘 存储 空间 ， 而 且 单 靠 手动 检查 这 些 修改 就 很 耗 时 间 。 这 时 ， 
发 送 一 个 差异 文件 就 显得 很 有 用 了 。 它 只 包含 那些 被 修改 过 、 添 加 或 删除 的 行 以 及 行 号 。 这 个 差 
异 文 件 被 称 为 修补 文件 ( patch file )。 我 们 可 以 用 patch 命 令 将 修补 文件 中 包含 的 更 改 信息 应 用 到 
原始 文件 。 也 可 以 再 次 进行 修补 来 撤销 改变 。 来 看 看 如 何 才 能 实现 这 一 切 。 








































































































3.12.1 ”实战 演练 
diff 命 令 可 以 生成 差异 文件 。 
(1) 为 了 生成 差异 信息 ， 先 创建 下 列 文件 。 
口 文件 1: version].txt 
this is the original text 
line2 
line3 


line4 
happy hacking |! 
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口 文件 2: version2.txt 


this is the original text 
line2 

line4 

happy hacking ! 

GNU is not UNIX 


(2) 非 一 体 化 (nonunified ) 形式 的 aiff 输 出 (不 使 用 -u 选 项 ) 如 下 : 


$ diff versionl.txt version2.txt 
3d2 

<line3 

6c5 

> GNU is not UNIX 


(3) 一 体 化 形式 的 aiff 输 出 如 下 : 





$ diff -u versionl.txt version2.txt 

--- Vversionl.txt 2010-06-27 10:26:54.384884455 +0530 
+++ Version2.txt 2010-06-27 10:27:28.782140889 +0530 
@@ -1,5 +1,5 @@ 

this is the original text 

line2 

-line3 

line4 

happy hacking ! 


+GNU is not UNIX 


选项 -u 用 于 生成 一 体 化 输出 。 因 为 一 体 化 输出 的 可 读 性 更 好 ， 更 易于 看 出 两 个 文件 
之 间 的 差异 ， 所 以 人 们 往往 更 喜欢 这 种 输出 形式 。 


在 一 体 化 aiff 输 出 中 ， 以 + 起 始 的 是 新 加 入 的 行 ， 以 - 起 始 的 是 删除 的 行 。 
(4) 修补 文件 可 以 通过 将 aiff 的 输出 重 定向 到 一 个 文件 来 生成 : 




















$ diff -u versionl.txt Version2 .txt > version.patch 


现在 就 可 以 用 patch 命 令 将 修改 应 用 于 任意 文件 。 当 应 用 于 version1.txt 时 , 我 们 就 可 
以 得 到 version2.txt; 而 当 应 用 于 version2.txt 时 ， 就 可 以 得 到 version1.txt。 


(5) 用 下 列 命 令 来 进行 修补 : 





$ patch -pl versionl.txt < version.patch 
patching file versionl .txt 


version1.txt 的 内 容 现 在 和 verson2.txt 的 内 容 一 模 一 样 。 
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(6) 下 面 的 命令 可 以 撤销 做 出 的 修改 : 


$ patch -pl versionl .txt < version.patch 
patching file versionl.txt 
Reversed (or previously applied) patch detected! Assume -R? [nl] y 


# 修改 被 撤销 
如 上 例 所 示 ， 修 补 已 修补 的 文件 将 撤销 修改 。 


在 撤销 修改 时 ， 若 使 用 patch 命 令 的 -R 选 项 ， 则 不 会 提示 用 户 y/n。 








3.12.2 ”补充 内 容 

让 我 们 再 看 一 些 aiff 的 其 他 特性 。 

生成 目录 的 差异 信息 

diff 命 令 也 能 够 以 递归 的 形式 作用 于 目录 。 它 会 对 目录 中 的 所 有 内 容 生成 差异 输出 。 使 用 
下 面 的 命令 : 

$ diff -Naur directoryl directory2 
上 面 命令 中 出 现 的 选项 含义 如 下 。 


口 -N: 将 所 有 人 缺失 的 文件 视 为 空 文件 。 
口 -a: 将 所 有 文件 视 为 文本 文件 。 
D -u: 生成 一 体 化 输出 。 

口 -r: 遍历 目录 下 的 所 有 文件 。 








3.13 使 用 head 与 tail 打印 文件 的 前 10 行 和 后 10 行 


当 查 看 上 千 行 的 大 文件 时 ， 我 们 可 不 会 用 cat 命 令 把 整个 文件 内 容 给 打印 出 来 。 相 反 ， 我 们 
只 会 查看 文件 的 一 小 部 分 内 容 ( 例如 文件 的 前 10 行 或 后 10 行 ) 有 时 候 可 能 需要 打印 出 文件 的 前 
行 或 后 n 行 ,也 有 可 能 需要 打印 出 除了 前 n 行 或 后 n 行 之 外 所 有 的 行 。 


还 有 一 种 情况 是 打印 文件 的 第 m 行 至 第 n 行 。 


head 和 tail 命 令 可 以 帮助 我 们 实现 这 些 需求 。 















































实战 演练 
head 命 令 总 是 读 取 输 入 文件 的 头 部 。 
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(1) 打印 前 10 行 : 
$ head file 
(2) 从 stain 读 取 数 据 : 
$ cat text | head 
(3) 指定 打印 前 几 行 : 
$ head -n 4 file 
该 命令 会 打印 文件 的 前 4 行 。 
(4) 打印 除了 最 后 M 行 之 外 所 有 的 行 : 


$ head -n -M file 


| 注意 ，-M 表 示 一 个 负数 ， 并 非 选项 。 | 


例如 ， 用 下 面 的 代码 打印 除了 最 后 5$ 行 之 外 的 所 有 行 : 





seq 11 | head -n -5 


$ seq 100 | head -mn 5 


(5) 将 最 后 几 行 排除 在 打印 范围 之 外 是 heaq 非 常 重要 的 一 种 用 法 。 来 看 看 如 何 打印 文件 
最 后 的 若干 行 。 打 印 文件 的 最 后 10 行 : 


$ tail file 


(6) 可 以 用 下 面 的 代码 从 stain 中 读 取 输 入 : 








$ cat text | tail 


(7) 打印 最 后 5 行 : 





$ tail -n 5 file 


(8) 打印 除了 前 M 行 之 外 所 有 的 行 : 
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$ tail -n +(M+1) 

例如 ， 打 印 除 前 5 行 之 外 的 所 有 行 ，M+1=6， 因 此 使 用 下 列 命 令 : 

$ seq 100 | tail -n +6 
这 条 命令 将 打印 出 第 6 行 至 第 100 行 。 

tail 命 令 的 一 个 重要 用 法 是 从 一 个 内 容 不 断 增 加 的 文件 中 读 取 数据 。 新 增加 的 内 容 总 是 被 
添加 到 文件 的 尾部 ， 因 此 当 新 内 容 被 写 人 文件 的 时 候 ， 可 以 用 tail 将 其 显示 出 来 。 只 是 如 果 简 
单 地 使 用 tai1 的 话 ， 它 只 会 读 取 文件 的 最 后 10 行 ， 然 后 退出 。 但 那 时 新 的 内 容 也 许 又 已 经 被 其 
他 进程 追加 到 文件 中 了 。 为 了 能 够 不 间断 地 监视 文件 的 增长 ，tail 有 一 个 特殊 的 选项 -f 或 
--follow， 它 们 会 使 fail 密 切 关 注 文件 中 新 添加 的 内 容 ， 并 随 着 数据 的 增加 持续 保持 更 新 : 














$ tail -f growing file 

你 可 能 希望 将 其 用 于 日 志文 件 。 监 视 文件 内 容 增 加 的 命令 如 下 : 

# tail -f /var/log/messages 
或 者 

$ dmesg | tail -f 

我 们 经 常会 运行 qmeg 查看 内 核 的 环形 缓冲 区 消息 ， 要 么 是 调试 USB 设 备 ， 要 么 是 查看 sqx 
(X 是 对 应 于 SCSI 磁 盘 的 sq 设备 的 次 序列 号 )。tail -f 也 可 以 加 入 一 个 睡眠 间隔 -<s， 这 样 我 们 
就 可 以 设置 监视 文件 更 新 的 时 间 间 隔 。 

tail 有 一 个 很 有 意思 的 特性 ， 当 某 个 给 定 进程 结束 之 后 ，tail 也 会 随 之 终结 。 

假设 我 们 正在 读 取 一 个 不 断 增长 的 文件 ， 进 程 Foo 一 直 在 向 该 文件 追加 数据 ， 那 么 tail -f 
就 会 一 直 执行 到 进程 Foo 结 


























$ PID=$ (pidof Foo) 
$ tail -f file --pid $PID 


当 进 程 Foo 结 束 之 后 ，tail 也 会 跟着 结 
让 我 们 实际 演练 一 下 。 


(1) 创建 一 个 新 文件 file.txt， 用 geait 打 开 这 个 文件 (你 也 可 以 使 用 其 他 文本 编辑 器 )。 
(2) 向 文件 添加 新 内 容 并 不 断 地 在 gedait 中 保存 。 
(3) 现在 运行 下 列 命令 : 














$ PID=$ (pidof gedit) 
$ tail -f file.txt --pid $PID 
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当 你 不 断 对 文件 进行 更 新 时 , 更 新 的 内 容 都 会 被 Lail 命 令 写 入 终端 。 当 关 闭 gedit 时 , tail 


命令 也 会 随 之 结束 。 


3.14 ”只 列 出 目录 的 各 种 方法 











用 脚本 只 列 出 目录 似乎 不 是 件 容 易 事 。 这 则 攻略 很 值得 学 习 ， 因为 它 介 绍 了 多 种 只 列 出 目录 





的 方法 与 技巧 。 


3.14.1 预备 知识 


有 很 多 种 方法 可 以 只 列 出 目录 。 当 你 向 其 他 人 询问 这 些 技术 的 时 候 , 你 得 到 的 第 一 个 答案 可 








only 


3.14.2 ”实战 演练 
有 好 几 种 方法 可 以 列 出 当前 路 径 下 的 目录 。 
(1) 使 用 1s -a: 
$ 1s -d */ 
(2) 使 用 grep 结 合 1s -F: 
$ 1s -F | grep "/$" 
(3) 使 用 grep 结 合 1s -1: 
$ 1s -1 | grep "an 
(4) 使 用 fina: 


$ find . 


3.14.3 ”工作 原理 


当 使 用 -F 时 ， 所 有 的 输出 项 都 会 添加 上 一 个 代表 文件 类 型 的 字符 ， 如 e、* 、| 等 。 





是 qir。 但 air 只 不 过 是 一 个 类 似 于 1s 且 选项 更 少 的 命令 。 让 我 们 来 看 看 如 何 列 出 目录 。 


-type d -maxdepth 1 -print 





目录 对 应 


的 是 / 字符 。 我 们 用 grep 只 过 滤 那 些 以 /$ 作为 行 尾 标记 的 输出 项 。 


1s -da 输出 的 每 一 行 的 首 字符 表示 文件 类 型 。 
过 滤 以 "a" 起 始 的 行 。^ 是 行 首 标记 。 











目录 的 文件 类 型 字符 是 "a" 。 因 此 我 们 用 grep 


find 命 令 可 以 指定 type 的 参数 为 目录 并 将 maxdepth 设 置 成 1， 这 是 因为 我 们 不 需要 继续 向 


下 搜索 。 
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3.15 在 命令 行 中 使 用 pusha 和 popd 进行 快速 定位 


当 在 终端 或 shell 提 示 符 下 涉及 多 处 位 置 时 , 我们 通常 所 做 的 就 是 复制 并 粘贴 路 径 。 但 如 果 没 
有 GUI, 只 能 通过 命令 行进 行 访问 时 ,这 招 就 难 有 用 武之 地 了 。 举 例 来 说 ,假如 同时 涉及 /Var/www、 
/home/slynux 和 和 musrsrc 目 录 ， 当 要 在 这 些 位置 之 间 进行 切换 时 ， 每 次 都 要 通过 键盘 输入 路 径 ， 这 
实在 是 一 件 很 麻烦 的 事 。 此 时 ， 我 们 就 可 以 使 用 诸如 pusha 和 popda 这 种 基于 命令 行 接口 
( Command-Line Interface，CLI) 的 定位 技术 。 让 我 们 来 看 看 它们 的 使 用 方法 。 































































































3.15.1 预备 知识 


pushd 和 popd 可 以 用 于 在 多 个 目录 之 间 进 行 切 换 而 无 需 复 制 并 粘贴 目录 路 径 .pushdq 和 popa 
以 栈 的 方式 来 运作 。 我 们 都 知道 栈 是 一 个 后 进 先 出 (Last In First Out, LIFO ) 的 数据 结构 。 目 录 
路 径 被 存储 在 栈 中 ， 然 后 用 push 和 pop 操 作 在 目录 之 间 进 行 切换 。 

















3.15.2 ”实战 演练 
使 用 pushd 和 popd 时 ， 可 以 无 视 cd 命 令 。 


(1) 压 入 并 切换 路 径 : 








~ $ pushd /var/www 

现在 ， 栈 中 包含 了 /varwww~， 当 前 目录 切换 到 /var/www。 
(2) 再 压 人 下 一 个 目录 路 径 : 

/var/www $ pushd /usr/src 


现在 栈 中 包含 srsrc /var/www ~， 当 前 目录 为 /usr/src。 


(3) 用 下 面 的 命令 查看 栈 内 容 : 





$ dirs 
/usr/src /var/www ~ /usr/share /etc 
0 1 2 3 4 


(4) 当 你 想 切 换 到 列表 中 任意 一 个 路 径 时 ， 将 每 条 路 径 从 0 到 nn 进行 编号 ， 然 后 使 用 你 希 
望 切 换 到 的 路 径 编 号 ， 例 如 : 


$ pushd +3 


这 条 命令 会 将 栈 进行 翻转 并 切换 到 目录 /use/share。 
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pushd 总 是 将 路 径 添加 到 栈 。 如 果 要 从 栈 中 删除 路 径 ， 可 以 使 用 popad。 
(5) 要 删除 最 后 添加 的 路 径 并 把 当前 目录 更 改 为 上 一 级 目录 ， 可 以 使 用 以 下 命令 : 
$ popd 


假设 现在 栈 包 含 /usrsrc /Var/www ~ /usr/share /etc， 当 前 目录 是 /usr/share，popd 会 将 
栈 更 改 为 /var/www ~ /usr/share /etc， 并 日 把 目录 切换 到 /var/www。 


(6) 用 popq +num 可 以 从 列表 中 移 除 特定 的 路 径 。 
num 是 从 左 到 右 ， 从 0 到 ”开始 计数 的 。 











3.15.3 ”补充 内 容 
让 我 们 再 进行 一 些 基本 的 目录 定位 练习 。 





在 常用 的 目录 之 间 切 换 





当 涉 及 3 个 以 上 的 目录 时 ， 可 以 使 用 pusha 和 popd。 但 是 如 果 只 涉及 两 个 位 置 的 时 候 ， 还 有 
另 一 个 更 简便 的 方法 : ca -。 


如 果 当 前 路 径 是 /varwww， 执 行 下 面 的 命令 : 


/var/www $ cd /usr/src 
/usr/src $ # 做 点 什么 


现在 要 切换 回 warwww， 你 不 需要 再 输入 一 次 ， 只 需要 执行 : 
/usr/src $ cd - 


你 还 可 以 再 切换 到 /usrsrc: 


/var/www $ cd - 


3.16 ”统计 文件 的 行 数 、 单 词 数 和 字符 数 

统计 文件 的 行 数 、 单 词 数 和 字符 数 在 文本 处 理工 作 中 发 挥 着 重要 作用 。 很 多 时 候 , 单词 或 字 
符 计数 被 作为 一 种 间接 的 技巧 来 生成 所 需要 的 输出 样式 及 结果 。 本 书 在 其 他 章节 就 包含 了 一 些 这 
样 的 实例 。 对 开发 人 员 来 说 , 统计 代码 行 数 是 一 件 重要 的 工作 。 我 们 可 能 需要 对 无 关 文件 之 外 的 
特定 类 型 的 文件 进行 统计 。 将 wc 结合 其 他 命令 有 助 于 我 们 实现 这 些 需 求 。 


















































wc 是 一 个 用 于 统计 的 工具 。 它 是 Word Count ( 单词 统计 ) 的 缩写 。 来 看 看 如 何 使 用 wc 统计 文 
件 的 行 数 、 单 词 数 和 字符 数 。 
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实战 演练 
我 们 可 以 使 用 wc 的 各 种 选项 来 统计 行 数 、 单 词 数 和 字符 数 。 
(1) 统计 行 数 : 


$ wc -1 file 

(2) 如 果 需 要 将 stdain 作 为 输入 ， 使 用 下 列 命令 : 
$ cat file | wc -1 

(3) 统计 单词 数 : 


$ wc -w file 
$ cat file | wc -w 


(4) 统计 字符 数 : 


$ wc -c file 
$ cat file | wc -c 


例如 ， 我 们 可 以 按照 下 面 的 方法 统计 文本 中 的 字符 数 : 


echo -n 1234 | we -c 
4 


-n 用 于 避免 echo 添 加 额外 的 换行 符 。 
(5) 当 不 使 用 任何 选项 执行 wc 时 : 





$ wc file 
1435 15763 112200 


它 会 分 别 打印 出 文件 的 行 数 、 单 词 数 和 字符 数 。 
(6) 使 用 -iL 选项 打印 出 文件 中 最 长 一 行 的 长 度 : 


$ wc file -L 
205 


3.17 打印 目录 树 

在 准备 教程 和 文档 时 , 将 目录 和 文件 系统 以 图 形 化 的 树 状 层次 结构 描述 ,一 定 会 为 你 增色 不 
少 。 在 编写 一 些 监控 脚本 时 ， 用 清晰 易 懂 的 树 状 描 述 方式 来 查看 文件 系统 ,同样 颇 有 益处 。 让 我 
们 来 看 看 这 是 如 何 实现 的 。 
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3.17.1 ”预备 知识 

tree 命 令 以 图 形 化 的 树 状 结构 打印 文件 和 目录 ,在 Linux 发 行 版 中 通常 并 没有 包含 这 个 命令 。 
你 需要 用 包 管理 器 自行 安装 。 
3.17.2 ”实战 演练 

下 面 是 树 状 Unix 文 件 系统 的 一 个 示例 : 

















$ tree ~/unixfs 





unixfs/ 

|-- bin 

| |-- cat 

| `-- 1s 

|-- etc 

| `-- passwd 

| -- home 

| | -- pactpub 

| | | -- automate . sh 
| | `-- _ schedule 
| “=-- slynux 

|-- opt 


8 directories, 5 files 
tree 命 令 有 很 多 有 意思 的 选项 ， 让 我 们 认识 一 下 其 中 的 几 项 。 
口 重点 标记 出 匹配 某 种 样式 的 文件 : 


$ tree path -P PATTERN # 用 通配符 描述 样式 

















例如 : 


$ tree PATH -P "*.sh" # 用 一 个 目录 路 径 代替 PRTH 
| -- home 

| | -- packtpub 

| | `-- _ automate . sh 


口 重点 标记 出 除 符 合 某 种 样式 之 外 的 那些 文件 : 
$ tree path -I PATTERN 
口 使 用 -h 选 项 同时 打印 出 文件 和 目录 的 大 小 : 


$ tree -h 
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3.17.3 ”补充 内 容 
请 看 一 个 有 趣 的 tree 命 令 选 项 。 
以 HTML 形 式 输出 目录 树 


tree 命 令 可 以 生成 HTMIL 输 出 。 例 如 ,用 下 面 的 命令 可 以 创建 一 个 包含 目录 树 输出 的 HTML 
文件 : 


$ tree PATH -H http://localhost -o out.html 


将 http://localhost 替 换 为 适合 存放 输出 文件 的 URL。 将 PATH 替 换 为 主 目录 的 真正 路 径 。 当 前 目录 
可 以 用 . 作为 PATH。 


根据 目录 列表 生成 的 Web 页 面 形 式 如 图 3-1 所 示 。 











Directory Tree 


http://localhoast 
|-= bin 

|-- etc 

|-- home 

| |-- pactpub 

| ~-- aatomate .sh 
| ~、-- slynux 

| -~ opt 

|-- tmp 

~-— usr 


8 directories, 1 上 tile 


tree v1.5.3 (c) 1996 - 2009 by Steve Baker and Thomas Moore 
HTML output hacked and copyleft (c) 1998 by Francesc Rocher 
Charsets | OS/2 support (c) 2001 by Kyosuke Tokoro 














图 3-1 
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本 章 内 容 
口 使 用 正则 表达 式 口 打印 文件 或 行 中 的 第 n 个 单词 或 列 
口 用 grep 在 文件 中 搜索 文本 口 打印 不 同行 或 样式 之 间 的 文本 = 
口 用 cut 按 列 切 分 文件 口 以 逆序 形式 打印 行 
口 使 用 seq 进 行文 本 替换 口 解析 文本 中 的 电子 邮件 地 址 和 URL 
口 使 用 awk 进 行 高 级 文本 处 理 口 在 文件 中 移 除 包含 某 个 单词 的 句子 
口 统计 特定 文件 中 的 词 频 口 对 目录 中 的 所 有 文件 进行 文本 替换 
口 压缩 或 解压 缩 JavaScript 口 文本 切片 与 参数 操作 
口 按 列 合 并 文件 
4.1 简介 





shell 脚 本 语言 包含 了 众多 用 于 解决 Unix/Linux 系 统 问 题 必 不 可 少 的 组 件 。 文 本 处 理 是 shell 脚 
本 擅长 的 重要 领域 之 一 。 它 可 以 与 sed、awk、grep、cut 这 类 优美 的 工具 组 合 在 一 起 来 解决 文 
本 处 理 相关 的 问题 。 

有 各 种 各 样 的 工具 能 够 帮助 我 们 从 不 同 的 细节 层面 上 处 理 文件 ， 比 如 字符 、 行 、 单 词 、 行 列 
等 ， 人 允许 我 们 用 多 种 方法 来 处 理 文本 文件 。 正 则 表达 式 是 模式 匹配 技术 的 核心 。 借 助 适 合 的 正则 
表达 式 ， 可 以 生成 我 们 所 需 的 各 类 输出 结果 ， 例 如 过 滤 、 剥 离 (strip )、 替 换 、 搜 索 等 。 

本 章 包括 一 系列 攻略 , 探讨 了 多 个 与 文本 处 理 相 关 的 问题 , 了解 这 些 问题 在 编写 用 于 解决 实 
际 问 题 的 脚本 时 大 有 神 益 。 


4.2 ”使 用 正则 表达 式 
正则 表达 式 是 基于 模式 匹配 的 文本 处 理 技术 的 关键 所 在 。 想 要 在 编写 文本 人 处 理工 具 方 面 驾 轻 








120 第 4 章 让 文本 飞 








就 熟 ,你 就 必须 对 正则 表达 式 有 一 个 基本 的 理解 。 通 配 符 能 够 匹配 的 文本 范围 相当 有 限 。 正 则 表 
达 式 是 一 种 用 于 文本 匹配 的 形式 小 巧 、 具 有 高 度 针 对 性 的 编程 语言 。 [a-z0-9_]+ 
@[a-z0-9]+\. [a-z]+ 就 是 一 个 能 够 匹配 电子 邮件 地 址 的 正则 表达 式 。 


看 起 来 有 点 怪异 是 吧 ? 别 担心 ， 跟 着 这 则 攻略 学 习 ， 你 就 会 发 现 它 其 实 很 简单 。 









































4.2.1 实战 演练 


正则 表达 式 是 由 字面 文本 和 具有 特殊 意义 的 符号 组 成 的 。 我 们 可 以 根据 具体 需求 , 使 用 它们 
构造 出 适合 的 正则 表达 式 来 匹配 文本 。 因 为 正则 表达 式 是 一 种 匹配 文本 的 通用 语言 , 因此 在 这 则 
攻略 中 我 们 不 再 介绍 其 他 工具 ， 留 待 本 章 其 他 攻略 中 再 叙 。 


来 看 几 个 文本 匹配 的 例子 。 
口 要 匹配 给 定 文本 中 的 所 有 单词 ， 可 以 使 用 下 面 的 正则 表达 式 : 


























( 2[a-zA-Z]+ ?) 

“?” 用 于 匹配 单词 前 后 可 能 出 现 的 空格 。[a-zA-z]+ 代 表 一 个 或 多 个 字母 (a~z 和 A~2 )。 
口 要 匹配 一 个 下 地 址 ， 可 以 使 用 下 面 的 正则 表达 式 : 

[0-9] {1,3}\.[0-9] {1,3}\.[0-9] {1,3}\.[0-9]{1,3} 

或 者 


[Liladigrts]] {Lr3)N. Ldigitr]l {L338\: Llrdiglt ll] {L333N. LLrdlioier llt{t1,3} 




















我 们 知道 耻 地 址 通常 的 书写 形式 是 192.168.0.2， 它 是 由 点 号 分 制 的 4 个 整数 ( 每 一 个 整数 
的 取 值 范围 从 0~255 )。 


[0-9] 或 [:digit:] 匹 配 数字 0~9。{1,3} 匹 配 1 到 3 个 数字 ，\ .匹配 "."。 























这 个 正则 表达 式 可 以 匹配 所 处 理 文 本 中 的 IP 地 址 , 但 它 并 不 检查 地 址 的 合法 
KN 性 。 例 如 ， 形 如 123. ee a ee ea 但 这 却 是 一 个 非法 
的 JP 地 址 。 不 过 在 解析 文本 流 时 ， 通 常 目 标 仅仅 是 找 出 JP 地 址 而 已 。 


4.2.2 ”工作 原理 
先 来 看 一 看 正则 表达 式 的 基本 组 成 部 分 ， 如 表 4-1 所 示 。 
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表 4-1 
正则 表达 式 描 述 示 例 

行 起 始 标 记 ^tux 匹配 以 tux 起 始 的 行 
$ 行 尾 标 记 tuxs 匹配 以 tux 结 尾 的 行 

匹配 任意 一 个 字符 Hack . 匹配 Hackl 和 Hacki， 但 是 不 能 匹配 Hackl2 和 Hackil， 

它 只 能 匹配 单个 字符 
[] 匹配 包含 在 [字符 ] 之 中 的 任意 一 个 字符 coo[k1] 匹配 cook 或 cool 
[^] 匹配 除 [^ 字 符 ] 之 外 的 任意 一 个 字符 9[^01] 匹配 922、93， 但 是 不 匹配 91 或 90 
[sj 匹配 [] 中 指定 范围 内 的 任意 一 个 字符 [1-5] 匹配 从 1 ~ 5 的 任意 一 个 数字 
? 匹配 之 前 的 项 1 次 或 0 次 colou?r 匹配 color 或 colour， 但 是 不 能 匹配 colouur 
+ 匹配 之 前 的 项 1 次 或 多 次 Rollno-9+ 匹配 Rollno-99 .Rollno-9 ,但 是 不 能 匹配 Rollno- 
* 匹配 之 前 的 项 0 次 或 多 次 co*1 匹配 cl、col、coool 等 
() 创建 一 个 用 于 匹配 的 子 串 ma (tri) ?x 匹配 max 或 maxtrix 
i 匹配 之 前 的 项 an 次 [0-9]{3} 匹配 任意 一 个 三 位 数 ，[0-9]{3} 可 以 扩展 为 4 
[0-9][0-9][0-9] 

{n,} 之 前 的 项 至 少 需 要 匹配 n 次 [0-9]{2,} 匹配 任意 一 个 两 位 或 更 多 位 的 数字 
， 、 的 项 所 必需 匹配 的 最 小 次 数 和 | 00] (2 5) 匹配 从 两 位 数 到 五 位 数 之 间 的 任意 一 个 数字 
| 交替 一 一 匹配 | 两 边 的 任意 一 项 oct (1st | 2nd) 匹配 Oct 1st 或 Oct 2nd 
。 转 义 符 可 以 将 上 面 介 绍 的 特殊 字符 进行 a\.b 匹 配 ab， 但 不 能 匹配 ajb。 通 过 在 .之 间 加 上 前 级 \， 





转 义 


从 而 忽略 了 . 的 特殊 意义 


更 多 细节 请 参考 : http://www.linuxforu.com/2011/04/sed-explained-part-1/。 


4.2.3 补充 内 容 
下 面 就 看 一 看 如 何在 正则 表达 式 中 赋予 某 些 
1. 处 理 特殊 字符 
正则 表达 式 用 $ 、^、 


“> 


{以 及 } 等 作为 特殊 


字符 特殊 含义 。 


2 hr 


子 付 o 








但 是 如 果 我 们 希望 将 这 些 字符 





作为 非特 殊 字 符 ( 表示 普通 字面 含义 的 字符 )， 应 该 怎么 做 呢 ? 来 看 一 个 正则 表达 式 的 例 





子 : 


a.txto 


2 /rr 2 2 hr 





它 会 匹配 字符 a， 然 后 是 任 


上 的 ".'， 而 非 任意 字符 。 


忆 子 付 

















， 接 着 是 字符 串 tx 
所 以 我 们 在 这 个 字符 之 前 加 上 了 


t。 但 是 我 们 希望 '.' 能 够 匹配 字面 意义 
一 个 反 斜 杠 \( 这 叫做 “将 该 字符 进行 








转 义 ”" )。 这 表明 正则 表达 式 希望 匹配 的 是 字面 字符 ， 而 不 是 它 所 代表 的 特殊 含义 。 因 此 ,最 终 的 


正则 表达 式 就 变 成 了 a\ .txt。 
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2. 可 视 化 正则 表达 式 





正则 表达 式 有 时 很 难 理解 , 但 是 人 们 更 易于 理解 带 有 图 示 的 事物 ,因此 就 出 现 了 一 些 将 正则 
表达 式 进 行 可 视 化 的 工具 。 你 可 以 通过 http://www.regexper.com 找 到 同类 工具 中 的 一 个 ,你 可 以 在 
这 个 工具 中 输入 正则 表达 式 ， 然 后 它 会 创建 出 一 个 漂亮 的 图 示 来 帮助 你 理解 。 图 4-1 就 是 上 一 节 
那个 正则 表达 式 的 可 视 化 截图 。 














[7 Ee Regexper— Mozills Firefox WW 
Firefox ~ | PO | 豆 | Regexper ©@| 和 | 
~ ed 国 wwwregexpercom v @| ~ Gopsls 的 贺 * 个 v 
REGEXPER ~ 
名 
2c 
Yau thought you only fad twe Froblems Wy 








4.3 用 grep 在 文件 中 搜索 文本 

在 文件 中 进行 搜索 是 文本 处 理 中 一 项 重要 工作 。 我 们 也 许 需要 在 某 些 多 达 上 千 行 的 文件 中 查 
找 所 需要 的 数据 。 这 则 攻略 将 教 你 如 何 从 大 量 数据 中 定位 符合 规格 的 数据 。 
4.3.1 实战 演练 


grep 命 令 作 为 Unix 中 用 于 文本 搜索 的 神奇 工具 ， 能 够 接受 正则 表达 式 ， 生 成 各 种 格式 的 输 
出 。 除 此 之 外 ， 它 还 有 大 量 有 趣 的 选项 。 让 我 们 看 看 具体 的 用 法 。 


(1) 搜索 包含 特定 模式 的 文本 行 : 
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$ grep pattern filename 
this is the line containing pattern 


或 者 


$ grep "pattern" filename 
this is the line containing pattern 


(2) 也 可 以 像 下 面 这 样 从 stain 中 读 取 : 


$ echo -e "this is a word\nnext line" | grep word 
this is a word 


(3) 单个 grep 命 令 也 可 以 对 多 个 文件 进行 搜索 : 
$ grep "match text" filel file2 file3 ... 


(4) 用 --color 选 项 可 以 在 输出 行 中 着 重 标记 出 匹配 到 的 单词 : 


$ grep word filename --color=auto 
this is the line containing word 
(5) grep 命 令 具 解释 match_text 中 的 某 些 特殊 字符 。 如果 要 使 用 正则 表达 式 , 需要 添 


加 -EE 选项 一 一 这 意味 着 使 用 扩展 (extended ) 正则 表达 式 。 或 者 也 可 以 使 用 默认 人 允 
许 正则 表达 式 的 grep 命 令 一 一 egrep。 例 如 : 











$ grep -E "[a-z]+" filename 
或 者 
$ egrep "[a-z]+" filename 
(6) 只 输出 文件 中 匹配 到 的 文本 部 分 ， 可 以 使 用 选项 -o: 


$ echo this is a line. | egrep -o "[a-z]+\." 
line. 


(7) 要 打印 除 包含 match_pattern 行 之 外 的 所 有 行 ， 可 使 用 : 





$ grep -V match pattern file 
选项 -v 可 以 将 匹配 结果 进行 反 转 (invert )。 
(8) 统计 文件 或 文本 中 包含 匹配 字符 串 的 行 数 : 





$ grep -c "text" filename 
10 


需要 注意 的 是 -c 只 是 统计 匹配 行 的 数量 ， 并 不 是 匹配 的 次 数 。 例 如 : 











$ echo -e "1 2 3 4\nhello\n5 6" | egrep -c "[0-9]" 
2 
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尽管 有 6 个 匹配 项 ， 但 命令 只 打印 出 2， 这 是 因为 只 有 两 个 匹配 行 。 在 单行 中 出 现 的 
多 次 匹配 只 被 统计 为 一 次 。 
(9) 要 文件 中 统计 匹配 项 的 数量 ， 可 以 使 用 下 面 的 技巧 : 


$ echo -e "1 2 3 4\nhello\n5 6" | egrep -o "[0-9]" | wc -1 
6 


(10) 打印 出 包含 匹配 字符 串 的 行 号 ; 





$ cat samplel .txt 
gnu is not unix 
linux is fun 
bash is art 

$ cat sample2.txt 
planetlinux 


$ grep linux -n samplel .txt 
2:1inux is fun 


或 者 
$ cat samplel.txt | grep linux -了 


如 果 涉 及 多 个 文件 ， 它 也 会 随 着 输出 结果 打印 出 文件 名 : 





$ grep linux -n samplel.txt sample2.txt 
samplel .txt:2:linux is fun 
sample2 .txt:2:planetlinux 


(11) 打印 模式 匹配 所 位 于 的 字符 或 字 节 俩 移 : 








$ echo gnu is not unix | grep -b -o "not" 
7T:not 


行 中 字符 串 的 字符 偏 移 是 从 该 行 的 第 一 个 字符 开始 计算 ， 起 始 值 是 0。 在 上 面 的 
例子 中 , "not" 的 偏 移 值 是 7 ( 也 就 是 说 , not 是 从 该 行 的 第 7 个 字符 开始 的 ， 即 “gnu 
is not unix” 这 一 行 )。 

































































选项 -b 总 是 和 -o 配 合 使 用 。 
(12) 搜索 多 个 文件 并 找 出 匹配 文本 位 于 哪 一 个 文件 中 : 
$ grep -1 linux samplel.txt sample2.txt 


samplel .txt 
sample2 .txt 


和 -1 相反 的 选项 是 -4， 它 会 返回 一 个 不 匹配 的 文件 列表 。 
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4.3.2 补充 内 容 


我 们 已 经 看 过 了 grep 命 令 的 基本 用 法 。 不 过 grep 的 本 事 可 不 止 如 此 ， 它 还 有 更 多 的 特性 。 
接着 看 看 grep 的 其 他 选项 。 


1. 递归 搜索 文件 
如 果 需 要 在 多 级 目录 中 对 文本 进行 递归 搜索 ， 可 以 使 用 : 





$ grep "text" 。 -R -n 


命令 中 的 “.” 指 定 了 当前 目录 。 


| ea grep 的 选项 -R 和 -r 功 能 一 样 。 


例如 : 





$ cd src dir 
$ grep "test function()" . -R -n 
./miscutils/test.c:16:test function(); 


test_function() 位 于 miscutils/test.c 的 第 16 行 。 


这 是 开发 人 员 使 用 最 多 的 命令 之 一 。 它 用 于 查找 某 些 文本 位 于 哪些 源 
性 一。 码 文件 中 。 


2. 忽略 样式 中 的 大 小 写 
选项 -i 可 以 使 匹配 样式 不 考虑 字符 的 大 小 写 ， 例如: 





$ echo hello world | grep -i "HELLO" 
hello 


3. 用 grep 匹 配 多 个 样式 
在 进行 匹配 的 时 候 通 常 只 指定 一 个 样式 。 然 而 ,我 们 可 以 用 选项 -e 来 指定 多 个 匹配 样式 : 





$ grep -e "patternil" -e "pattern" 
例如 : 


$ echo this is a line of text | grep -e "this" -e "line" -o 
this 
line 
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还 有 男 一 种 方法 也 可 以 指定 多 个 样式 。 我们 可 以 提供 一 个 样式 文件 用 于 读 取样 式 。 在 样式 文 





件 中 逐 行 写 下 需要 匹配 的 样式 ， 然 后 用 选项 -f 执 行 grep: 
$ grep -f pattern filesource filename 
例如 : 
$ cat pat_ file 
hello 
cool 


$ echo hello this is cool | grep -f pat_ file 
hello this is cool 


4. 在 grep 搜 索 中 指定 或 排除 文件 


grep 可 以 在 搜索 过 程 中 指定 (include ) 或 排除 ( exclude ) 某 些 文件 。 我 们 通过 通配符 来 指 
定 所 include 文 件 或 exclude 文 件 。 


目录 中 递归 搜索 所 有 的 .c 和 .cpp 文件 : 








$ grep "main()" . -r --include *.{c,cpp} 


注意 ，some{string1,string2, string3} 会 扩展 成 somestringl somestring2 somestring3。 


在 搜索 中 排除 所 有 的 README 文 件 : 





$ grep "main()" . -r --exclude "README" 

如 果 需 要 排除 目录 ， 可 以 使 用 --exclude-qdir 选 项 。 

如 果 需 要 从 文件 中 读 取 所 需 排除 的 文件 列表 ， 使 用 --excluqe-fromFILE。 

5. 使 用 0 值 字 节 作 为 后 缀 的 grep 与 zargs 

xargs 命 令 通常 用 于 将 文件 名 列表 作为 命令 行 参数 提供 给 其 他 命令 。 当 文件 名 用 作 命令 行 参 
数 时 ， 建 议 用 0 值 字 节 作为 文件 名 终止 符 ， 而 非 空 格 。 因 为 一 些 文件 名 中 会 包含 空格 字符 ， 一旦 
它 被 误解 为 终结 符 ， 那 么 单个 文件 名 就 会 被 认为 是 两 个 文件 名 ( 例如 ，New file.txt 被 解析 成 New 
和 file.txt 两 个 文件 名 ), 这 个 问题 可 以 利用 0 值 字 节 后 缀 来 避免 。 我 们 使 用 xargs 以 便 从 诸如 grep、 
find 中 接收 stain 文 本 。 这 些 命令 可 以 将 带 有 0 值 字 节 后 级 的 文本 输出 到 staqout。 为 了 指明 输入 
的 文件 名 是 以 0 值 字 节 (\0 ) 作为 终止 符 ， 需要 在 xargs 中 使 用 -0。 

创建 测试 文件 : 

$ echo "test" > filel 


$ echo "cool" > file2 
$ echo "test" > file3 
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在 下 面 的 命令 序列 中 , grep 使 用 -z 选 项 输出 以 0 值 字 节 作为 终结 符 的 文件 名 ( \0 ),xargs -0 
读 取 输入 并 用 0 值 字 节 终 结 符 分 隔 文件 名 : 


$ grep "test" file* -12 | xargs -0 rm 
-Zz 通常 和 - -1 结 合 使 用 。 
6. grep 的 静默 输出 


有 时 候 , 我 们 并 不 打算 查看 匹配 的 字符 串 ， 而 只 是 想 知道 是 否 能 够 成 功 匹 配 。 这 可 以 通过 设 
置 grep 的 静默 选项 ( -a ) 来 实现 。 在 静默 模式 中 ，grep 命 令 不 会 输出 任何 内 容 。 它 仅 是 运 
令 ， 然 后 根据 命令 执行 成 功 与 否 返 回 退出 状态 。 

如 果 命 令 运 行 成 功 会 返回 0， 如 果 失 败 则 返回 非 0 值 。 


让 我 们 来 看 一 个 脚本 , 这 个 脚本 利用 grep 的 静默 模式 来 测试 文本 匹配 是 否 存 在 于 某 个 文件 中 。 


#!/bin/bash 
# 文件 名 : silent_grep.sh 
# 用 途 : 测试 文件 是 否 包 含 特定 的 文本 内 容 


























if [ $# -ne 2 ]; then 
echo "Usage: $0 match text filename" 
exit 1 

生计 


match_ text=$1 
filename=$2 
grep -q "$match text" $filename 


if [ $? -eq 0 ]; then 

echo "The text exists in the file" 
else 

echo "Text does not exist in the file" 
二 


a 0 ( Student ) 和 一 个 文件 名 ( student_data.txt ) 作为 
命令 参数 : 


$ ./silent grep.sh Student student data.txt 
The text exists in the file 


7. 打印 出 匹配 文本 之 前 或 之 后 的 行 

















基于 上 下 文 的 打印 是 grep 的 特色 之 一 ,假设 已 经 找到 了 给 定 文本 的 匹配 行 ,通常 情况 下 grep 
只 会 打印 出 这 一 行 。 但 我 们 也 许 需 要 匹配 行 之 前 或 之 后 的 n 行 ,也 可 能 两 者 丝 要 。 这 可 以 在 grep 
中 用 前 后 行 控制 选项 来 实现 。 来 看 看 具体 的 做 法 。 
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要 打印 匹配 某 个 结果 之 后 的 3 行 ， 使 用 -A 选项 : 





seq 10 | grep 5 -A 3 


$ 
5 
6 
7 
8 





要 打印 匹配 某 个 结果 之 前 的 3 行 ， 使 用 -B 选 项 : 





seq 10 | grep 5 -B 3 


$ 
2 
3 
4 
5 





要 打印 匹配 某 个 结果 之 前 以 及 之 后 的 3 行 ， 使 用 -c 选 项 : 


seq 10 | grep 5 -C 3 


$ 
2 
3 
4 
5 
6 
7 
8 


如 果 有 多 个 匹配 ， 那 么 使 用 -- 作 为 各 部 分 之 间 的 定 界 符 : 


$ echo -e "a\nb\nc\na\nb\nc" | grep a -BR 1 
a 
b 


a 
b 


4.4 用 cut 按 列 切 分 文件 


我 们 可 能 需要 按 列 ， 而 不 是 按 行 来 切 分 文件 。 假 设 我 们 有 一 个 文本 文件 ,其 中 按 行 包 含 了 学 
生 的 报表 信息 ,例如 Roll、Name、Mark、Percentage。 我们 需要 将 学 生 的 姓名 或 者 是 第 n 列 提取 到 
另 一 个 文件 ， 也 可 能 需要 其 中 两 列 甚 至 更 多 。 这 则 攻略 将 为 你 演示 如 何 完 成 这 项 任务 。 




















4.4.1 实战 演练 


cut 是 一 个 帮 有 我 们 将 文本 按 列 进行 切 分 的 小 巧 工具 。 它 也 可 以 指定 分 隔 每 列 的 定 界 符 。 在 cut 
的 术语 中 ， 每 列 被 称 为 一 个 字段 。 
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(1) 要 提取 特定 的 字段 或 列 ， 可 以 使 用 下 面 的 语法 : 
cut -f FIELD LIST filename 


FIELD_LIST 是 需要 显示 的 列 。 它 由 列 号 组 成 ， 彼 此 之 间 用 逗号 分 隔 。 例 如 ; 




















$ cut -E 2,3 filename 


这 条 命令 将 显示 第 2 列 和 第 3 列 。 
(2) cut 也 能 够 从 stdqin 中 读 取 输入 文本 。 


制 表 符 是 字段 或 列 的 默认 定 界 符 。 对 于 没有 定 界 符 的 行 , 会 将 该 行 照 原 样 打印 出 来 。 
如 果 不 想 打印 出 这 种 不 包含 定 界 符 的 行 ， 则 可 以 使 用 cut 的 -s 选 项 。 一 个 cut 命 令 
的 例子 如 下 : 








$ cat student data.txt 


No Name Mark Percent 

1 Sarath 45 90 4 
2 Alex 49 98 

3 Anu 45 90 





$ cut -fl1 student data.txt 


No 
1 
2 
3 
(3) 提取 多 个 字段 : 
$ cut -E2,4 student data.txt 
Name Percent 
Sarath 90 
Alex 98 
Anu 90 


(4) 要 打印 多 列 ， 需 要 提供 一 个 由 逗号 分 隔 的 列 号 列表 作为 -f 选 项 的 参数 。 


(5) 我 们 也 可 以 用 --complement 选 项 对 提取 的 字段 进行 补 集运 算 。 假 设 有 多 个 字段， 
你 希望 打印 出 除 第 3 列 之 外 的 所 有 列 ， 则 可 以 使 用 : 





$ cut -f3 --complement student data.txt 
No Name Percent 

1 Sarath 90 

2 Alex 98 

3 Anu 90 


(6) 要 指定 字段 的 定 界 符 ， 使 用 -a 选项 : 





A 
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$ cat delimited data.txt 
No;Name;Mark;Percent 
1;Sarath;45;90 
2;Alex;49;98 

3;Anu;45;90 


$ cut -E2 -d";" delimited data.txt 
Name 

Sarath 

Alex 

Anu 


4.4.2 ”补充 内 容 


cut 命 令 有 一 些 选项 可 以 将 一 串 指定 的 字符 作为 列 来 显示 。 让 我 们 来 看 看 这 些 选项 。 





指定 字段 的 字符 或 字 节 范围 

假设 我 们 不 依赖 定 界 符 ， 但 需要 通过 将 字段 定义 为 一 个 字符 范围 〈 行 首 记 为 0 ) 来 进行 字段 
提取 。 这 种 需求 也 可 以 用 cut 来 实现 。 

表 4-2 中 列 出 了 对 应 的 记 法 。 





















































表 4-2 
记 法 范 国 
N- 从 第 N 个 字 节 ， 字 符 或 字段 到 行 尾 
N-M 从 第 NM 个 字 节 ， 字 符 或 字段 到 第 WM 个 (包括 第 W 个 在 内 ) 字 节 、 字 符 或 字段 
-M 第 1 个 字 节 ， 字 符 或 字段 到 第 WM 个 〈 包 括 第 WM 个 在 内 ) 字 节 、 字 符 或 字段 





用 上 面 介 绍 的 记 法 ， 结 合 下 列 选项 将 字段 指定 为 某 个 范围 内 的 字 节 或 字符 : 


口 -b 表示 字 节 ; 
口 -c 表示 字符 ; 
口 -上 用 于 定义 字段 。 


例如 : 


$ cat range fields.txt 

abcdefghijklmnopqrstuvwxyz 
abcdefghijklmnopqrstuvwxyz 
abcdefghijklmnopqrstuvwxyz 
abcdefghijklmnopqrstuvwxy 


你 可 以 打印 第 1 个 到 第 5 个 字符 : 
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$ cut -cl1l-5 range fields.txt 
abcde 
abcde 
abcde 
abcde 


打印 前 2 个 字符 : 


$ cut range fields.txt -c -2 
ab 
ab 
ab 
ab 


若 要 用 字 节 作为 计数 单位 ， 
在 使 用 -c、 





--output-delimiter 


当 用 -pb 或 -c 提 取 多 个 字段 时 ， 
的 字段 了 。 例 如 : 


"delimiter string" 


必须 使 用 --output-delimiter， 否则 ， 你 就 没 法 区 分 不 同 


可 以 将 -c 替 换 成 -b。 
-f 和 -b 时 ， 我 们 可 以 指定 输出 定 界 符 





$ cut range fields.txt -cl1l-3,6-9 --output-delimiter "," 


abc, fghi 
abc, fghi 
abc, fghi 
abc, fghi 


4.5 ”使 用 sea 进行 文本 替换 


0 ( stream editor ) 的 缩写 。 它 
达 式 使 用 ， 功 能 不 同 凡响 。seq 命 令 众 所 周知 的 一 
命令 0 党 用 技术 。 

















是 文本 处 理 中 不 可 或 缺 的 工具 ， 


能 够 配合 正则 表 
一 个 用 法 是 进行 文本 替换 。 这 则 攻略 包括 了 sea 




















4.5.1 实战 演练 
(1) sed 可 以 替换 给 定 文本 中 的 字符 串 。 
$ sed 's/pattern/replace string/' file 
或 者 


$ cat file | sed 's/pattern/replace string/' 


该 命令 从 stain 中 读 取 输入 。 
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如 果 你 用 的 是 vi 编辑 器 ， 你 会 发 现 它 用 于 替换 文本 的 命令 和 
~> sed 的 非常 相似 。 








(2) 在 默认 情况 下 ，sed 只 会 打印 蔡 换 后 的 文本 。 如 果 需 要 在 替换 的 同时 保存 更 改 ,可 以 
使 用 -i 选 项 ， 可 以 将 替换 结果 应 用 于 原文 件 。 很 多 用 户 在 进行 替换 之 后 ， 会 借助 重 
定向 来 保存 文件 : 


$ sed 's/text/replace/' file >newfile 





$ mv newfile file 


其 实 只 需要 一 行 命令 就 可 以 搞定 ， 例 如 : 








$ sed -i 's/text/replace/' file 

(3) 之 前 看 到 的 sed 命 令 会 将 每 一 行 中 第 一 处 符合 模式 的 内 容 蔡 换 掉 ,但 是 如 果 要 替换 所 
有 内 容 ， 我 们 需要 在 命令 尾部 加 上 参数 g， 其 方法 如 下 : 
$ sed 's/pattern/replace string/g' file 


后 缀 /g 意 味 着 seq 会 替换 每 一 处 匹配 。 但 是 有 时 候 我 们 只 需要 从 第 "处 匹配 开始 蔡 
换 。 对 此 ， 可 以 使 用 /Ng 选项 。 


请 看 下 面 的 命令 : 


$ echo thisthisthisthis | sed 's/this/THIS/2g' 
thisTHISTHISTHIS 
































$ echo thisthisthisthis | sed 's/this/THIS/3g' 
thisthisTHISTHIS 


$ echo thisthisthisthis | sed 's/this/THIS/4g' 
thisthisthisTHIS 


字符 /在 seda 中 被 作为 定 界 符 使 用 。 我 们 可 以 像 下 面 一 样 使 用 任意 的 定 界 符 : 











Sed 's:text:replace:g' 
sed 's|text|zeplace|g' 


当 定 界 符 出 现在 样式 内 部 时 ， 我 们 必须 用 前 缀 \ 对 它 进 行 转 义 : 
sed '!s|te\|xzt|zeplace|g' 


\| 是 一 个 出 现在 样式 内 部 并 经 过 转 义 的 定 界 符 。 


4.5.2 ”补充 内 容 


sed 命 令 包 含 大 量 可 用 于 文本 处 理 的 选项 。 将 这 些 选 项 以 合理 的 次 序 组 合 ， 可 以 只 用 一 行 命 
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令 就 解决 很 多 复杂 的 问题 。 让 我 们 看 看 这 些 选项 。 
1. 移 除 空白 行 
用 seq 移 除 空白 行 不 过 是 小 荣 一 碟 。 空 白 行 可 以 用 正则 表达 式 ^$ 进行 匹配 : 








$ sed '/*$/d' file 
/pattern/d 会 移 除 匹配 样式 的 行 。 


在 空 日 行 中, 行 尾 标 记 紧 随 着 行 首 标 记 。 








2. 直接 在 文件 中 进行 替换 


如 果 将 文件 名 传递 给 sed, 它 会 将 文件 内 容 输出 到 staout。 如 果 我 们 想 修改 文件 内 容 , 可 以 
使 用 -i 选项 : 





$ sed 's/PATTERN/replacement/' -i filename 


例如 ， 使 用 指定 的 数字 替换 文件 中 所 有 3 位 数 的 数字 : 








$ cat sed data.txt 
11 abc 111 this 9 file contains 111 11 88 numbers 0000 


$ sed -i 's/\b[0-9] \{3\}\b/NUMBER/g' sed data.txt 

$ cat sed data.txt 

11 abc NUMBER this 9 file contains NUMBER 11 88 numbers 0000 
上 面 的 单行 命令 蔡 换 了 所 有 的 3 位 数字 。 正 则 表达 式 \b[0-9]\ {3\}\b 用 于 匹配 3 位 数字 。[0-9] 
表示 数位 取 值 范围 ,也 就 是 说 从 0~9。{31} 表 示 匹 配 之 前 的 字符 3 次 。\ {3\} 中 的 \ 用 于 转 义 {和 }。 
\b 表 示 单 词 边界 。 





一 种 有 益 的 做 法 是 先 使 用 不 带 -i 选 项 的 seq 命 令 , 以 确保 正则 表达 式 没有 问 
题 ， 一旦 结果 符合 要 求 ， 再 加 入 -i 选项 将 更 改写 入 文件 。 另 外 ， 你 也 可 以 使 用 
下 列 形式 的 sed: 


Q sed -i .bak 's/abc/def/' file 


这 时 的 sed 不 仅 执行 文件 内 容 蔡 挽 ， 还 会 创建 一 个 名 为 file.bak 的 文件 ， 其 中 
包含 着 原始 文件 内 容 的 副本 。 


3. 已 匹配 字符 串 标记 (&) 


在 sed 中 ， 我 们 可 以 用 s 标 记 匹 配 样 式 的 字符 串 ， 这 样 就 能 够 在 替换 字符 串 时 使 用 已 匹配 的 
内 容 。 
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例如 : 


$ echo this is an example | sed 's/\w\+/[&]/g' 
[this] [is] [an] [example] 


正则 表达 式 \w\+ 匹配 每 一 个 单词 ， 然 后 我 们 用 [sg] 蔡 换 它 。g 对 应 于 之 前 所 匹配 到 的 单词 。 





4. 子 串 匹配 标记 (\1) 

& 代表 匹配 给 定 样式 的 字符 串 。 但 我 们 也 可 以 匹配 给 定 样 式 的 其 中 一 部 分 。 来 看 看 具体 的 
做 法 。 

$ echo this is digit 7 in a number | sed 's/digit \([0-9]\)/\1/' 

this is 7 in a number 


这 条 命令 将 digit 7 替换 为 7。 样 式 中 匹配 到 的 子 串 是 7。\ (pattern\) 用 于 匹配 子 串 。 模式 被 包 
括 在 使 用 斜 线 转 义 过 的 () 中 。 对 于 匹配 到 的 第 一 个 子 串 ， 其 对 应 的 标记 是 \1， 匹 配 到 的 第 二 个 
子 串 是 \2， 往 后 依次 类 推 。 下 面 的 示例 中 包含 了 多 个 匹配 : 


























$ echo seven EIGHT | sed 's/\([a-z]\+\) \([A-Z]\+\)/\2 \1/' 
EIGHT seven 


( [a-z]\+\) 匹配 第 一 个 单词 ，( [A-z]\+\) 匹 配 第 二 个 单词 。\1 和 \2 用 来 引用 它们 。 这 种 引用 
被 称 为 向 后 引用 (back reference )。 在 替换 部 分 ， 它 们 的 次 序 被 更 改 为 \2 \1， 因 此 结果 就 呈现 
出 逆序 的 形式 。 


5. 组 合 多 个 表达 式 


可 以 利用 管道 组 合 多 个 sed 命 令 : 











sed 'expression' | sed 'expression' 
它 等 价 于 
$ sed 'expression; expression' 
或 者 
$ sed -e 'expression' -e expression' 
例如 : 
$ echo abc | sed 's/a/A/' | sed 's/c/C/' 
AbC 
$ echo abc | sed 's/a/A/;s/c/C/' 
AbC 


$ echo abc | sed -e 's/a/A/' -e 's/c/C/' 
AbC 
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6. 引用 


sedq 表 达 式 通常 用 单 引 号 来 引用 。 不 过 也 可 以 使 用 双 引 号 。 双 引号 会 通过 对 表达 式 求 值 来 对 
其 进行 扩展 。 当 我 们 想 在 seq 表 达 式 中 使 用 一 些 变量 时 ， 双 引号 就 能 派 上 用 场 了 。 


例如 : 











$ text=hello 
$ echo hello world | sed "s/$text/HELLO/" 
HELLO world 





stext 的 求 值 结果 是 hello。 


4.6 ”使 用 awk 进行 高 级 文本 处 理 


awk 是 一 款 设计 用 于 数据 流 的 工具 。 它 颇 有 玩 头 的 原因 就 在 于 可 以 对 列 和 行进 行 操作 。awk 
有 很 多 内 建 的 功能 ， 比 如 数组 、 函 数 等 ， 这 是 它 和 C 语 言 的 相同 之 处 。 灵 活性 是 awk 最 大 的 
优势 。 








4.6.1 预备 知识 
awk 脚本 的 结构 基本 如 下 所 示 : 
awk ' BEGIN{ print "start" } pattern { commands } END{ print "end" } file 
awk 命令 也 可 以 从 stain 中 读 取 。 


awk 脚本 通常 由 3 部 分 组 成 。BEGIN，END 和 带 模 式 匹 配 选 项 的 常见 语句 块 。 这 3 个 部 分 都 是 可 
选项 ， 在 脚本 中 可 省 略 任意 部 分 。 





4.6.2 ”实战 演练 
以 下 awk 脚 本 被 包含 在 单 引 号 或 双 引 号 之 间 : 





awk 'BEGIN { statements } { statements } END { end statements }' 


也 可 以 使 用 : 





awk "BEGIN { statements } { statements } END { end statements }" 
例如 : 


$ awk 'BEGIN { i=0 } { i++ } END{ print i}' filename 
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或 者 


$ awk "BEGIN { i=0 } { i++ } END{ print i }" filename 


4.6.3 工作 原理 

awk 命令 的 工作 方式 如 下 所 注 。 

(1) 执行 BEGIN { commands } 语句 块 中 的 语句 。 

(2) 从 文件 或 stain 中 读 取 一 行 ， 然 后 执行 pattern { commands }。 重 复 这 个 过 程 ， 直 到 
文件 全 部 被 读 取 完毕 。 

(3) 当 读 至 输入 流 末 尾 时 ， 执 行 END { commands } 语句 块 。 


BEGIN 语 句 块 在 awk 开始 从 输入 流 中 读 取 行 之 前 被 执行 。 这 是 一 个 可 选 的 语句 块 ， 诸 如 变量 
初始 化 、 打 印 输出 表格 的 表 头 等 语句 通常 都 可 以 写 人 BEGIN 语 句 块 中 。 


END 语 句 块 和 BEGIN 语 句 块 类 似 。END 语 句 块 在 awk 从 输入 流 中 读 取 完 所 有 的 行 之 后 即 被 执 
行 。 像 打印 所 有 行 的 分 析 结 果 这 类 汇总 信息 ， 都 是 在 END 语 句 块 中 实现 的 常见 任务 ( 例如 ， 在 比 
较 过 所 有 的 行 之 后 ， 打 印 出 最 大 数 )。 它 也 是 一 个 可 选 的 语句 块 。 

最 重要 的 部 分 就 是 pattern 语 句 块 中 的 通用 命令 。 这 个 语句 块 同 样 是 可 选 的 。 如 果 不 提 供 该 
语句 块 ， 则 默认 执行 { print }， 即 打印 所 读 取 到 的 每 一 行 。awk 对 于 每 一 行 ， 都 会 执行 这 个 语 
句 块 。 这 就 像 一 个 用 来 读 取 行 的 while 循 环 ， 在 循环 体 中 提供 了 相应 的 语句 。 

每 读 取 一 行 ，awk 就 会 检查 该 行 和 提供 的 样式 是 否 匹配 。 样 式 本 身 可 以 是 正则 表达 式 、 条 件 
语句 以 及 行 匹 配 范围 等 。 如 果 当 前 行 匹配 该 样式 ， 则 执行 { } 中 的 语句 。 

样式 是 可 选 的 。 如 果 没 有 提供 样式 ， 那 么 awk 就 认为 所 有 的 行 都 是 匹配 的 ， 并 执行 { } 中 的 
语句 Lo) 

让 我 们 看 看 下 面 的 例子 : 


$ echo -e "linel\nline2" | awk 'BEGIN{ print "Start" } { print } END{ print "End" } ' 
Start 
linel 














































































































line2 
End 


当 使 用 不 带 参 数 的 print 时 ， 它 会 打印 出 当前 行 。 关 于 print， 需 要 记 住 两 件 重 要 的 事情 : 
当 print 的 参数 是 以 逗号 进行 分 隔 时 ,参数 打印 时 则 以 空格 作为 定 界 符 。 在 awk 的 print 语 句 中 ， 
双 引 号 是 被 当做 拼接 操作 符 ( concatenation operator ) 使 用 的 。 
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例如 : 


$ echo | awk '{ varL="vL") Var2="vVv2"7 var3="Vv3"; \ 
print varl,var2,var3 ; }' 


语句 将 按照 下 面 的 格式 打印 变量 


V1 v2 v3 








echo 命 令 向 标准 输出 写 和 一行 ， 因 此 awk 的 { } 语句 块 中 的 语句 只 被 执行 一 次 。 如 果 awk 的 
标准 输入 包含 多 行 ， 那 么 { } 语句 块 中 的 命令 就 会 被 执行 多 次 。 


拼接 的 使 用 方法 如 下 : 








$ echo | awk '{ varl="v1l"; var2="v2"; var3="v3"; \ 
print varl "-" var2 "-" var3 ; }' 


输出 为 : 
V1l-v2-v3 


{ 类似 于 一 个 循环 体 ， 会 对 文件 中 的 每 一 行进 行 迭代 。 





BEGIN 语 和 句 块 中 。 在 END{} 语 句 块 中 ， 往 往 会 放 入 打印 结果 等 语句 。 





| a 我 们 通常 将 变量 初始 化 语句 ( 如 var=0 ) 以 及 打印 文件 头 部 的 语句 放 入 


4.6.4 补充 内 容 


awk 命令 具有 丰富 的 特性 。 要 想 洞悉 awk 编程 的 精妙 之 处 ,首先 应 该 熟悉 awk 重要 的 选项 和 功 




















能 。 让 我 们 来 看 看 awk 的 一 些 重要 功能 。 
1. 特殊 变量 
以 下 是 可 以 用 于 awk 的 一 些 特殊 变量 。 
口 NR: 表示 记录 数量 ， 在 执行 过 程 中 对 应 于 当前 行 号 。 
口 NF: 表示 字段 数量 ， 在 执行 过 程 中 对 应 于 当前 行 的 字段 数 。 
口 $0: 这 个 ee 
口 $1: 这 个 变量 包含 第 一 个 字段 的 文本 内 容 。 
口 $2: 这 个 变量 包含 第 二 个 字段 的 文本 内 容 。 
例如 : 


$ echo -e "linel f2 f3\nline2 f4 f5\nline3 f6 f7" | \ 
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awk '{ 

print "Line no:"NR",No of fields:"NF, "$0="$0, "$1="$1,"$2="$2,"$3="$3 
于 

Line no:1,No of fields:3 $0=linel f2 ft3 $1=linel $2=f2 $3=f£3 

Line no:2,No of fields:3 $0=line2 f4 f5 $1=line2 $2=f4 $3=f5 

Line no:3,No of fields:3 $0=line3 f6 £7 $1=line3 $2=f£f6 $3=f£7 


我 们 可 以 用 print $NF 打 印 一 行 中 最 后 一 个 字段 ， 用 $ (NF-1) 打印 倒数 第 二 个 字段 ， 其 他 
字段 依次 类 推 即 可 。 


awk 的 printf() 函数 的 语法 和 C 语 言 中 的 同名 函数 一 样 。 我 们 也 可 以 用 这 个 函数 来 代替 
ELH 
再 来 看 awk 的 一 些 基 本 用 法 。 打 印 每 一 行 的 第 2 和 第 3 个 字段 : 
Sawk '{ print $3,$2 }' file 


要 统计 文件 中 的 行 数 ， 使 用 下 面 的 命令 : 


























$ awk 'END{ print NR }' file 


这 里 只 使 用 了 END 语 句 块 。 每 读 入 一 行 ，awk 会 将 NR 更 新 为 对 应 的 行 号 。 当 到 达 最 后 一 行 时 ， 
NR 中 的 值 就 是 最 后 一 行 的 行 号 ， 于 是 ， 位 于 END 语 句 块 中 的 NR 就 包含 了 文件 的 行 数 。 


你 可 以 将 每 一 行 中 第 一 个 字段 的 值 按照 下 面 的 方法 进行 累加 : 









































$ seq 5 | awk 'BEGIN{ sum=0; print "Summation:" } 
{ print $1"+"; sum+=$1 } END { print "=="; print sum }' 
Summation: 


2. 将 外 部 变量 值 传递 给 awk 
借助 选项 -v， 我 们 可 以 将 外 部 值 ( 并非 来 自 stain ) 传递 给 awk: 





$s VAR=10000 
$ echo | awk -Vv VARIABLE=S$SVAR '{ print VARIABLE }' 
10000 


还 有 另 一 种 灵活 的 方法 可 以 将 多 个 外 部 变量 传递 给 awk， 例 如 : 


$ varl="Variablel" ; var2="Variable2" 
$ echo | awk '{ print vl,v2 }' vl=$varl v2=$var2 
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Variablel Variable2 
当 输 入 来 自 于 文件 而 非 标 准 输入 时 ， 使 用 下 列 命 令 : 
$ awk '{ print vi,v2 }' vil=$varl v2=$var2 filename 


在 上 面 的 方法 中 ， 变 量 之 间 用 空格 分 隔 ， 以 键 - 值 对 的 形式 (v1=$var1l v2=$var2 ) 作为 awk 的 
命名 行 参数 紧 随 在 BEGIN、{} 和 END 语 句 块 之 后 。 











3. 用 get1line 读 取 行 


awk 通 常 默 认 读 取 一 个 文件 的 所 有 行 。 如 果 只 想 读 取 某 一 行 ， 可 以 使 用 getline 函 数 。 有 了 时 
候 ， 我 们 需要 从 BEGIN 语 句 块 中 读 取 第 一 行 。 














语法 : getline var。 变 量 var 就 包含 了 特定 行 的 内 容 。 如 果 调 用 不 带 参 数 的 getline， 我 
们 可 以 用 so0、$1 和 $2 访 问 文本 行 的 内 容 。 








例如 : 


$ seq 5 | awk 'BEGIN { getline; print "Read ahead first line", $0 } { print $0 }' 
Read ahead first line 1 
全 


3 

4 

5 

4. 使 用 过 滤 模 式 对 awk 处 理 的 行进 行 过 滤 

我 们 可 以 为 需要 处 理 的 行 指定 一 些 条 件 ， 例 如 : 

$ awk 'NR < 5' # 行 号 小 于 5 的 行 

$ awk 'NR==1,NR==4' # 行 号 在 1 到 5 之 间 的 行 

$ awk '/linux/' # 包含 样式 linux 的 行 (可 以 用 正则 表达 式 来 指定 模式 ) 
$ awk '!1/linux/' # 不 包 金 包含 模式 为 1inux 的 行 

5. 设置 字段 定 界 符 


默认 的 字段 定 界 符 是 空格 。 我 们 也 可 以 用 -F "delimiter" 明 确 指定 一 个 定 界 符 : 








$ awk -F: '{ print SNE }' /etc/passwd 
或 者 
awk 'BEGIN { FS=":" } { print $NF }' /etc/passwd 


在 BEGIN 语 句 块 中 则 可 以 用 oFs="delimiter" 设 置 输出 字段 的 定 界 符 。 


由 
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6. 从 awk 中 读 取 命 令 输 出 


在 下 面 的 代码 中 , echo 会 生成 一 个 空白 行 。 变量 cmdout 包 含 命令 grep root /etc/passwd 
的 输出 ， 该 命令 会 打印 出 包含 root 的 行 。 


将 命令 的 输出 结果 读 入 变量 output 的 语法 如 下 : 
"command" | getline output ; 
例如 : 


$ echo | awk '{ "grep root /etc/passwd" | getline cmdout ; print cmdout }' 
root:x:0:0:root:/root:/bin/bash 


通过 使 用 get1line， 我 们 将 外 部 shell 命 令 的 输出 读 入 变量 cmdout。 
awk 支持 以 文本 作为 索引 的 关联 数组 。 
7. 在 awk 中 使 用 循环 
在 awk 中 可 以 使 用 for 循 环 ， 其 格式 如 下 : 








for(i=0;i<10;i++) { print $i ; } 
或 者 
for(i in array) { print array[i]; } 
8. awk 内 建 的 字符 串 控制 函数 
awk 有 很 多 内 建 的 字符 串 控制 函数 ， 让 我 们 认识 一 下 其 中 部 分 函数 。 


口 length (string): 返回 字符 串 的 长 度 。 

口 index (string，search_string): 返回 search_string 在 字符 串 中 出 现 的 位 置 。 

口 split (string,，array，delimiter): 用 定 界 符 生 成 一 个 字符 串 列表 ， 并 将 该 列表 存 
人 数组 。 

口 substr(string，start-position，end-position) : 在 字符 串 中 用 字符 起 止 仿 移 
量 生 成 子 串 ， 并 返回 该 子 串 。 

口 sub(regex, replacement_ str, string): 将 正则 表达 式 匹配 到 的 第 一 处 内 容 替 换 
成 replacment_str。 

口 gsub (regex, replacment_str，string): 和 sub() 类 似 。 不 过 该 函数 会 蔡 换 正则 表 
达 式 匹配 到 的 所 有 内 容 。 

口 match (regex，string) : 检查 正则 表达 式 是 否 能 够 匹配 字符 串 。 如 果 能 够 匹配 ， 返 回 
非 0 值 ; 否则 ， 返 回 9。match () 有 两 个 相关 的 特殊 变量 ,分 别 是 RSTART 和 RLENGTH。 变 
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量 RSTART 包 含 正 则 表达 式 所 匹配 内 容 的 起 始 位 置 ， 而 变量 RLENGTH 包 含 正则 表达 式 所 匹 
配 内 容 的 长 度 。 





4.7 统计 特定 文件 中 的 词 频 


统计 文件 中 使 用 单词 的 频率 是 一 个 不 错 的 练习 , 在 这 里 能 够 应 用 我 们 业已 习 得 的 文本 处 理 技 
巧 。 词 频 统计 的 方法 有 很 多 。 让 我 们 看 看 具体 的 做 法 。 





4.7.1 预备 知识 


我 们 可 以 使 用 关联 数组 、awk、sed、grep 等 不 同 的 方式 来 解决 这 个 问题 。 单 词 是 由 空格 或 
句号 分 隔 的 字母 组 合 。 首先 我 们 应 该 解析 出 给 定 文 件 中 出 现 的 所 有 单词 ,然后 统计 每 个 单词 的 出 
现 的 次 数 。 单 词 解析 可 以 用 正则 表达 式 配 合 sed、awk 或 grep 等 工具 来 完成 。 








4.7.2 ”实战 演练 
我 们 已 经 了 解 了 实现 原理 。 现 在 来 动手 创建 如 下 的 脚本 : 
#!/bin/bash 


# 文件 名 : word_freq.sh 
# 用 途 : 计算 文件 中 单词 的 词 频 





if [ S# -ne 1 ]; 

then 
echo "Usage: $0 filename"; 
exit -1 

六 


filename=$1 

egrep -o "\p[[:alpha:]]+\b" $filename | \ 
awk '{ count[$0]++ } 

END{ printf("%$-14s%s\n","Word","Count") ; 
for(ind in count) 

{ printf("%-1l4s%d\n",ind,count[ind]); } 
}， 

输出 如 下 : 


$ ./word freq.sh words.txt 
Word Count 
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used 1 
this 2 
counting 1 


4.7.3 工作 原理 


egrep -o "\b[[:alpha:]]+\b" $filename 只 用 于 输出 单词 。 用 -o 选 项 打印 出 由 换行 
符 分 隔 的 匹配 字符 序列 。 这 样 我 们 就 可 以 在 每 行 中 列 出 一 个 单词 。 


\b 是 单词 边界 标记 符 。[ :alpha: ] 是 表示 字母 的 字符 类 。awk 命 令 用 来 避免 对 每 一 个 单词 
进行 近代 。 因 为 awk 默 认 会 逐 行 执行 {} 块 中 的 语句 ， 所 以 我 们 就 不 需要 再 为 同样 的 事 编写 循环 了 。 
营 助 关联 数组 ， 当 执行 count [$0]++ 时 ， 单 词 计数 就 增加 。 最 后 ， 在 END{} 语 句 块 中 通过 和 迭代 所 有 
的 单词 ， 就 可 以 打印 出 单词 及 它们 各 自 出 现 的 次 数 。 












































4.7.4 参考 
口 1.7 节 讲解 了 Bash 中 的 数组 。 


口 4.6 节 介绍 了 awk 命令 。 





4.8 压缩 或 解 庄 缩 JavaScript 


JavaScript 广 泛 用 于 网 站 设计 。 在 编写 JavaScript 代 码 时 ， 出 于 代码 可 读 性 与 方便 维护 方面 的 
考虑 , 我 们 有 必要 使 用 一 些 空格 、 注 释 和 制 表 符 。 但 这 些 会 增加 JavaScript 文 件 的 大 小 。 随 着 文件 
体积 的 增加 ， 网 页 载 人 的 时 间 也 随 之 延长 。 因 此 ， 多 数 专业 网 站 为 了 加 快 页 面 载 人 速度 ， 都 会 对 
JavaScript 文 件 进 行 压缩 。 这 多 是 通过 压缩 空白 字符 和 换行 符 的 数量 来 实现 的 ( 也 被 称 为 minified 
JS )。 对 于 压缩 过 的 JavaScript， 还 可 以 通过 加 入 足够 的 空白 字符 和 换行 符 进行 解压 缩 ， 以 便 恢 复 
代码 的 可 读 性 。 这 则 攻略 就 尝试 利用 shell 中 实现 类 似 的 功能 。 









































4.8.1 预备 知识 


我 们 准备 写 一 个 JavaScript 压 缩 工具 或 代码 混乱 器 ,当然 , 还 包括 与 之 对 应 的 解压 缩 工 具 。 来 
考虑 下 面 的 Javascript 代 码 : 


$ cat sample.js 





function sign out() 
{ 


$("#loading") .show(); 
$.get("log in",{logout:"True"}, 
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Eunction(){ 
window.1location=""; 
}); 
} 


下 面 是 压缩 JavaScript 所 需要 完成 的 工作 : 


(1) 移 除 换行 符 和 制 表 符 ; 
(2) 压缩 空格 ; 
(3) 替换 注释 /* 内 容 */。 


要 解压 缩 或 者 恢复 JavaScript 的 可 读 性 ， 我 们 则 需要 


口 用 ;\n 替换 ; ; 
口 用 {\n 替换 {，\n} 替换 }。 
































4.8.2 ”实战 演练 
按照 之 前 叙述 过 的 步 又， 我 们 使 用 下 面 的 命令 序列 : 





$ cat sample.js | \ 

tr -d '\n\t' | tr -s AN\ 

| sed 's:/\*.*\*/::g' \ 

| sed 's/ \?\([{}();7,:1\) \?/\1/g' 
得 到 输出 : 


function sign out(){$("#loading") .show();$.get("log in",{logout:"True"}, 
function() {window.location="";});} 


接着 写 一 个 可 以 将 这 些 混乱 的 代码 恢复 正常 的 解压 缩 脚 本 : 
$ cat obfuscated.txt | sed 's/;/;\n/g; s/{/{\n\n/g; s/}/\n\n}/g' 
或 者 
$ cat obfuscated.txt | sed 's/;/;\n/g' | sed 's/{/{\n\n/g' | sed 's/}/\n\n}/g' 


该 脚本 在 使 用 上 存在 局 限 : 它 会 删除 本 不 该 删除 的 空格 。 假 如 有 下 列 语句 : 


来 解决 。 如 果 需 要 处 理 关 键 JavaScript 代 码 ， 最 好 还 是 使 用 功能 完善 的 工具 


人 Var a = "hello world" 
两 个 空格 会 被 转换 成 一 个 。 这 种 问题 可 以 使 用 我 们 讲解 过 的 模式 匹配 工具 
来 实现 。 
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4.8.3 工作 原理 
通过 执行 下 面 的 步 又 来 进行 压缩 。 


(1) 移 
tr 
(2) 移 
tr 


G) 移 





除 '\n' 和 tt': 
二 NE 
除 多 余 的 空格 : 


-Ss ' '!' 或 者 sed 's/[ ]\+/ /g' 





除 注释 : 


sed Ss/\* es\ /Sg 





因为 我 们 需要 使 用 /* 和 */， 所 以 用 :作为 sed 的 定 界 符 ， 这样 就 不 必 对 / 进行 转 
义 了 。 
* 在 sed 中 被 转 义 为 \x。 


.* 用 来 匹配 /* 与 */ 之 间 所 有 的 文本 。 
(4) 移 除 {、}、(、)、;、: 以 及 ,前 后 的 空格 。 


sed, sy VV CE CE SN) VENLAG 

上 面 的 seq 语 句 含义 如 下 。 

口 sed 代 码 中 的 / \?\([{t }();,:]\) \?/ 用 于 匹配 ，/ 八 1/g 用 于 替换 。 

口 \([{ }();,:]\) 用 于 匹配 集合 [ { }( ) ; ，: ] (出 于 可 读 性 方面 的 考虑 ， 





口 








在 这 里 加 入 了 空格 ) 中 的 任意 一 个 字符 。\ (和 \) 是 分 组 操作 符 ， 用 于 记忆 所 匹配 的 
内 容 ， 以 便 在 替换 部 分 中 进行 向 后 引用 。 对 (和 ) 转 义 之 后 ， 它 们 便 具备 了 另 一 种 特 
殊 的 含义 ， 进 而 可 以 将 它们 作为 分 组 操作 符 。 位 于 分 组 操作 符 前 后 的 \? 用 来 匹配 
可 能 出 现在 字符 集合 前 后 的 空格 。 

在 命令 的 替换 部 分 ， 匹 配 字 符 串 〈 也 就 是 一 个 可 选 的 空格 、 一 个 来 自 字 符 集 的 字 
符 再 加 一 个 可 选 的 空格 ) 被 匹配 的 子 字符 串 所 替换 。 对 于 匹配 的 子 字符 串 使 用 了 
向 后 引用 ， 并 通过 分 组 操作 符 () 记录 了 匹配 内 容 。 可 以 用 符号 \1 向 后 引用 分 组 
所 匹配 的 内 容 。 





















































解压 缩 命令 工作 方式 如 下 : 


口 s/;/;\n/g 将 ;替换 为 ;\n; 
口 s/{/{\n\n/g 将 { 蔡 换 为 {\n\n; 
口 s/}/\n\n}/g 将} 蔡 换 为 \n\nj}。 





4.9 按 列 合并 多 个 文件 145 





4.8.4 参考 


口 2.6 节 讲解 了 tr 命令 。 
口 4.5 节 讲解 了 sed 命 令 。 





4.9” 按 列 合 并 多 个 文件 


很 多 时 候 我 们 需要 按 列 拼接 文件 ， 比 如 要 将 每 一 个 文件 的 内 容 作为 单独 的 一 列 。 而 cat 命 令 
所 实现 的 拼接 通常 是 按照 行 来 进行 的 。 





4.9.1 实战 演练 
可 以 用 paste 命 令 实现 按 列 拼接 ， 其 语法 如 下 : 
$ paste filel file2 file3 ... 


让 我 们 来 尝试 一 下 : 





cat filel.txt 


$ 
1 
2 
3 
4 
5 


$ cat file2.txt 
slynux 

gnu 

bash 

hack 

$ paste filel.txt file2.txt 
lslynux 

2gnu 

3bash 

4hack 

5 


默认 的 定 界 符 是 制 表 符 ， 也 可 以 用 -a 明确 指定 定 界 符 ， 例 如 : 


$ paste filel.txt file2.txt -Q "," 
1,slynux 

2,gnu 

3,bash 

4,hack 

5, 
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4.9.2 ”参考 
4.4 节 讲解 了 如 何 从 文本 文件 中 提取 数据 。 


4.10 ”打印 文件 或 行 中 的 第 n 个 单词 或 列 


我 们 可 能 有 一 个 包含 了 多 列 数据 的 文件 , 不 过 只 有 其 中 的 一 小 部 分 能 派 上 用 场 。 例如 在 以 成 
绩 排序 的 学 生 列表 中 ， 我 们 希望 得 到 成 绩 最 高 的 四 名 学 生 。 来 看 看 如 何 实现 。 











4.10.1 实战 演练 
处 理 这 种 任务 最 为 广泛 的 方法 就 是 借助 awk。 同 样 也 可 以 使 用 cut 来 实现 。 
(1) 用 下 面 的 命令 打印 第 5 列 : 








$ awk '{ print $5 }' filename 


Q2) 也 可 以 打印 多 列 数据 ， 并 在 各 列 间 插 和 指定 的 字符 串 。 











如 果 要 打印 当前 目录 下 各 文件 的 权限 和 文件 名 ， 可 以 使 用 下 列 命令 : 
$ 1s -1 | awk '{ print $1 " : " $8 3}' 
-rw-r--r-- : delimited data.txt 
-rw-r--r-- : Obfuscated.txt 
-rw-r--r-- : pastel .txt 
-rw-r--r-- : paste2.txt 
4.10.2 ”参考 





口 4.4 节 讲解 了 如 何 从 文本 文件 中 提取 数据 。 
口 4.6 节 讲解 了 awk 命令 。 














4.11 打印 行 或 样式 之 间 的 文本 


我 们 有 时 候 可 能 需要 根据 某 些 条 件 打印 文本 的 某 一 部 分 , 比如 由 行 号 或 起 止 样式 所 匹配 的 文 
本 范围 。 让 我 们 来 看 看 如 何 实现 这 些 需 求 。 


























4.11.1 预备 知识 
我 们 可 以 用 awk、grep 和 sed 这 类 工具 来 根据 条 件 打印 某 些 文本 区 域 。 不 过 , 我 仍然 觉得 awk 
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是 最 简单 明了 的 方法 。 下 面 就 看 看 如 何 使 用 awk 完成 这 项 任务 。 


4.11.2 ”实战 演练 
(1) 要 打印 出 从 M 行 到 M 行 这 个 范围 内 的 所 有 文本 ， 使 用 下 面 的 语法 : 
$ awk 'NR==M, NR==N' filename 
也 可 以 用 stain 作 为 输入 : 
$ cat filename | awk 'NR==M, NR==N' 
(2) 把 mM 和 N 换 成 具体 的 数字 : 


$ seg 100 | awk 'NR==4,NR==6' 
4 
5 
6 





(3) 要 打印 处 于 start_pattern 与 end_pattern 之 间 的 文本 ,使 用 下 面 的 语法 : 
$ awk '/start pattern/, /end pattern/' filename 
例如 : 


$ cat section.txt 
line with patternl 
line with pattern2 
line with pattern3 
line end with pattern4 
line with pattern5 


$ awk '/pa.*3/, /end/' section.txt 


line with pattern3 
line end with pattern4 


用 于 awk 中 的 样式 为 正则 表达 式 。 


4.11.3 ”参考 


4.6 节 讲解 了 awk 命令 。 


4.12 ”以 逆序 形式 打印 行 
这 一 节 的 内 容 很 简单 。 讲 的 东西 可 能 看 起 来 用 处 不 大 ,不 过 它 可 以 用 来 在 Bash 中 模拟 栈 结构 ， 
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所 以 还 是 有 些 意思 的 。 下 面 我 们 来 将 一 个 文件 中 的 文本 行 以 逆序 形式 打印 出 来 。 


4.12.1 预备 知识 


只 需要 用 点 awk 的 小 技巧 就 能 完成 这 项 任务 。 不 过 ,命令 tac 可 以 直接 搞定 。 这 个 命令 的 名 


只 需 
称 其 实 就 是 反 过 来 书写 的 cat。 


4.12.2 ”实战 演练 
先 来 试 试 tac。 
(1) 该 命令 的 语法 如 下 : 
tac filel file2 .… 
它 也 可 以 从 stain 中 读 取 : 
seq 5 | tac 


$ 
5 
4 
3 
2 
1 











在 tac 中 ，\n 是 默认 的 行 分 隔 符 。 但 我 们 也 可 以 用 -s "分 隔 符 "选项 指定 自己 的 分 





隔 符 。 
CO) 使 用 awk 的 实现 方式 如 下 : 
$ segqag 9 | 


awk '{ lifo[NR]=$0 } 


END{ for(lno=NR;lno>-1;lno--){ print lifo[lno]; } 


}' 


在 shell 脚 本 中 ，、 可 以 很 方便 地 将 单行 命令 拆 解 成 多 行 。 


4.12.3 工作 原理 


这 个 awk 脚本 非常 简单 。 我 们 将 每 一 行 都 存 人 一 个 关联 数组 中 , 用 行 号 作为 数组 索引 行 











号 由 NR 给 出 )， 最 后 由 awk 执行 END 语句 块 。 为 了 得 到 最 后 一 行 的 行 号 ,在 { } 语 句 块 中 使 用 





lno=NR。 因 此 ， 这 个 脚本 从 最 后 一 行 一 直 和 迭代 到 第 0 行 ， 


打印 出 来 。 


将 存储 在 数组 中 的 各 行 以 逆序 方式 
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4.13 ”解析 文本 中 的 电子 邮件 地 址 和 URL 


从 给 定 的 文件 中 解析 出 所 需要 的 文本 是 从 事 文本 处 理 时 常见 的 一 项 任务 。 诸 如 电子 邮件 地 
址 、URL 等 都 能 够 借助 适合 的 正则 表达 式 找 出 来 。 我 们 通常 需要 从 一 个 包含 大 量 无 关 字符 及 单词 
的 电子 邮件 客户 列表 或 HTML 网 页 中 将 电子 邮件 地 址 解析 并 提取 出 来 。 

















4.13.1 实战 演练 
能 够 匹配 一 个 电子 邮件 地 址 的 正则 表达 式 如 下 : 
[A-2a-z0-9._]+@[A-2Za-z0-9.]+\.[a-zA-2] {2,4} 
例如 : 
$ cat url email.txt 
this is a line of text contains,<email> #slynux@slynux.com. </email> and email address, 


blog "http://www.google.com", test@yahoo.com dfdfdfdddfdf;cool.hacks@gmail .com<br /> 
<a href="http://code.google.com"><h1l>Heading</hi1> 


因为 用 到 了 扩展 正则 表达 式 ( 例如 + )， 所 以 得 使 用 egrep 命 令 。 





$ egrep -o '[A-Za-2z0-9. ]+@[A-Za-2z0-9.]+\.[a-zA-Z] {2,4}' url email.txt 
slynux@slynux .com 

test@yahoo.com 

cool.hacks@gmail .com 


匹配 HTTP URL 的 egrep 正 则 表达 式 如 下 : 
http://[la-zA-Z20-9\-\.]+\.[a-zA-2Z] {2,4} 

例如 : 
$ egrep -oO "http://[a-zA-20-9.]+\.[a-zA-2Z] {2,3}" url email.txt 


http://www.google.com 
http://code.google.com 


4.13.2 ”工作 原理 


如 果 逐 个 部 分 进行 设计 , 这些 正则 表达 式 其 实 很 简单 ,在 匹配 电子 邮件 地 址 的 正则 表达 式 中 ， 
我 们 都 知道 电子 邮件 地 址 可 以 采用 name@domain.some_2-4_letter 这 种 形式 。 那 么 ,在 编写 
正则 表达 式 时 ， 也 要 遵循 同样 的 规则 : 


[A-Za-z0-9.]+@[A-Za-2z0-9.]+\. [a-zA-2] {2,4} 
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[A-Za-z0-9.]+ 表 示 在 表示 字面 意义 的 字符 @ 出 现 之 前 ，[] 中 的 字符 组 合 应 该 出 现 一 次 或 多 
次 (这 也 正 是 + i )。 然 后 [A-za-z0-9.] 同样 应 该 出 现 一 次 或 多 次 (+ )。 样 式 \. 表示 
应 该 呈现 一 个 表示 字面 意义 的 “.”( 点 号 )， 而 [a-zA-2Z] {2,4}) 表 示 字 母 的 长 度 应 该 在 2 到 4 之 
间 (包括 2 和 4 )。 


匹配 HTTP URL 与 匹配 电子 邮件 地 址 类 似 ， 只 是 不 需要 匹配 name@ 部 分 。 








http://[la-zA-20-9.1+\. [a-zA-2] {2.,3} 


4.13.3 ”参考 


口 4.2 节 讲解 了 如 何 使 用 正则 表达 式 。 
口 4.5 节 讲解 了 sed 命 令 。 

















4.14 在 文件 中 移 除 包含 某 个 单词 的 句子 


只 要 能 写 出 正确 的 正则 表达 式 , 移 除 包含 某 个 单词 的 句子 简直 就 是 手 到 擒 来 。 这 里 给 出 了 一 
个 解决 类 似 问题 的 练习 。 





4.14.1 预备 知识 
sed 是 进行 文本 替换 的 不 二 之 选 。 这 样 ， 我 们 就 可 以 通过 seq 用 空白 奉 代 匹配 的 句子 。 











4.14.2 ”实战 演练 
先 创 建 一 个 包含 蔡 换文 本 的 文件 。 例 如 : 





$ cat sentence.txt 

Linux refers to the family of Unix-like computer operating systems that use the Linux 
kernel. Linux can be installed on a wide variety of computer hardware, ranging from 
mobile phones, tablet computers and video game consoles, to mainframes and supercomputers. 


Linux is predominantly known for its use in servers. 
我 们 的 目标 是 移 除 包含 “mobile phones” 的 句子 。 可 以 用 下 面 的 sedq 语 句 来 实现 : 


$ sed 's/ [^.]*mobile phones[^.]*\.//g' sentence.txt 


Linux refers to the family of Unix-like computer operating systems 
that use the Linux kernel. Linux is predominantly known for its use 


in servers. 
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< 
| ea somo otra wt otan tres | 


4.14.3 工作 原理 


让 我 们 分 析 一 下 sed 的 正则 表达 式 's/ [^.]*mobile phones[^.]*\.//g'。 该 正则 表达 
式 的 格式 为 : 's/ 匹 配 模式 /替代 字符 串 /g' 。 它 将 与 匹配 样本 相 匹 配 的 每 一 处 内 容 都 用 替代 字符 
串 进行 替换 。 

这 里 的 匹配 模式 是 用 来 匹配 整 句 文本 的 正则 表达 式 。 文 件 中 的 每 一 句 话 第 一 个 字符 都 是 空 
格 ， 句 与 句 之 间 都 以 “.” 来 分 隔 。 因 此 我 们 需要 匹配 内 容 的 格式 就 是 : 空格 + 若干 文本 + 需要 匹 
配 的 字符 串 + 若干 文本 + 和 句点。 一 个 句子 除了 作为 定 界 符 的 句点 之 外 , 可 以 包含 任意 字符 。 因 此 我 
们 要 使 用 [^.]。[^.]* 可 以 匹配 除 句点 之 外 的 任何 字符 的 组 合 。 用 来 匹配 文本 的 “mobile phone” 
被 放置 在 两 个 [^.]* 之 间 。 每 一 个 匹配 的 句子 均 被 / /替换 (注意 ，/ 与 /之 间 没 有 任何 内 容 )。 



































4.14.4 ”参考 


口 4.2 节 讲解 了 如 何 使 用 正则 表达 式 。 
口 4.5 节 讲解 了 sed 命 令 。 





4.15 ”对 目录 中 的 所 有 文件 进行 文本 替换 

我 们 经 常 需要 将 某 个 目录 中 的 所 有 文件 内 的 一 部 分 文本 替换 成 另 一 部 分 。 例如 在 网 站 的 源 文 
件 目录 中 替换 一 个 URI。 解 决 这 个 问题 最 快 的 方法 就 是 利用 shell 脚 本 。 
4.15.1 实战 演练 


就 目前 我 们 所 掌握 的 知识 , 首先 使 用 find 定 位 需要 进行 文本 替换 的 文件 。 然 后 使 用 seq 进 行 
实际 的 蔡 换 操作 。 


假设 我 们 希望 将 所 有 .cpp 文 件 中 的 copyright 替 换 成 Copyleft : 





$ find . -name *.cpp -print0 | xargs -I{} -0 sed -i 's/Copyright/Copyleft/g' {} 


4.15.2 ”工作 原理 
我 们 使 用 fina 在 当前 目录 下 查找 所 有 的 .cpp 文 件 ， 然 后 使 用 print0 打 印 出 以 null 字 符 (\0 ) 
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作为 分 隔 符 的 文件 列表 。( 这 可 以 避免 文件 名 中 的 空格 所 带 来 的 麻烦 。) 接着 使 用 通道 将 列表 传递 
给 xargs， 后 者 将 对 应 的 文件 作为 sed 的 参数 ， 由 sed 对 文件 内 容 进行 修改 。 





4.15.3 ”补充 内 容 

回忆 一 下 ，finG 有 一 个 选项 -exec， 它 可 以 对 每 个 fing 查 找到 的 文件 执行 命令 。 我 们 可 以 
使 用 该 选项 实现 同样 的 效果 : 

$ find . -name *.cpp -exec sed -i 's/Copyright/Copyleft/g' \{\} \; 
或 者 

$ find . -name *.cpp -exec sed -i 's/Copyright/Copyleft/g' \{\} \+ 


尽管 这 两 个 命令 作用 相同 ， 但 第 一 个 命令 会 为 每 个 查找 到 的 文件 调用 一 次 seda， 而 在 第 二 个 命令 
中 ，find 会 将 多 个 文件 名 一 并 传递 给 sed。 





4.16 文本 切片 及 参数 操作 


这 则 攻略 讲述 了 一 些 简单 的 文本 蔡 换 技术 以 及 Bash 中 可 用 的 参数 扩展 简写 方法 。 这 些 简单 的 
技巧 通常 能 够 让 我 们 免 于 键盘 敲 击 之 茄 。 











4.16.1 实战 演练 
让 我 们 来 练 练 手 吧 。 
替换 变量 内 容 中 的 部 分 文本 : 
$ var="This is a line of text" 


$ echo ${var/line/REPLACED} 
This is a REPLACED of text" 


1ine 被 替换 成 REPLACED。 


我 们 可 以 通过 指定 字符 串 的 起 始 位 置 和 长 度 来 生成 子 串 ， 语 法 如 下 : 








s{variable name:start position:length} 


用 下 面 的 命令 可 以 打印 第 5 个 字符 之 后 的 内 容 : 





$ string=abcdefghijklmnopqrstuvwxyz 
$ echo S${string:4} 
efghijklmnopqrstuvwxyz 
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从 第 5 个 字符 开始 ， 打 印 8 个 字符 : 

$ echo $s{string:4:8} 

efghijkl 

起 始 字符 的 索引 从 0 开始 计数 。 我 们 也 可 以 从 后 向 前 计数 ,将 最 后 一 个 字符 索引 记 为 -1。 但 
如 果 使 用 负数 作为 索引 值 ， 则 必须 将 负数 放 入 括号 内 。(-1) 就 是 最 后 一 个 字符 的 索引 。 


echo ${string: (-1)} 

z 

$ echo $s{string: (-2):2} 
yz 


4.16.2 ”参考 
4.5 节 讲解 了 从 单词 中 切 分 字符 。 
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本 章 内 容 

口 Web 页 面 下 载 口 网 页 相册 生成 器 

口 以 纯 文本 形式 下 载 网 页 口 Twitter 命令 行 客户 端 

口 cURL 入 门 口 基于 Web 后 端的 定义 查询 工具 

口 从 命令 行 访问 Gmail 口 查找 网 站 中 的 无 效 链接 

口 解析 网 站 数据 口 跟踪 网 站 变更 

口 图 片 抓 取 需 及 下 载 工 具 口 以 POST 方式 发 送 网 页 并 读 取 响 应 
5.1 入 门 





Web 正 在 成 为 反映 技术 发 展 的 晴雨 表 和 数据 处 理 中 心 。 尽 管 shell 脚 本 没 法 像 PHP 一 样 在 Web 
上 大 包 大 揽 ,， 但 还 是 有 不 少 活 儿 挺 适合 它 。 本 章 会 研究 一 些 用 于 解析 网 站 内 容 、 下 载 数据 、 发 送 
数据 表单 以 及 网 站 维护 任务 自动 化 之 类 的 例子 。 我 们 可 以 用 短 短 几 行 脚 本 就 将 很 多 原本 需要 通过 
浏览 器 交互 进行 的 活动 自动 化 。 借 助 命令 行 工具 ， 利 用 HTTP 协 议 所 提供 的 功能 ， 我 们 可 以 用 脚 
本 解决 大 部 分 Web 自 动 化 的 问题 。 来 尽情 享受 接 下 来 的 内 容 吧 。 











5.2 Web 页 面 下载 


从 给 定 的 URL 中 下 载 文件 或 页 面 很 简单 。 一 些 命令 行 下 载 工 具 就 可 以 完成 这 项 任务 。 


5.2.1 预备 知识 


wget 是 一 个 用 于 文件 下 载 的 命令 行 工 具 ， 选 项 繁多 且 用 法 灵活 。 
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5.2.2 ”实战 演练 
用 wget 可 以 下 载 网 页 或 远程 文件 : 





$ wget URL 
例如 : 


$ wget http://slynux.org 

--2010-08-01 07:51:20-- http://slynux.org/ 

Resolving slynux.org... 174.37.207.60 

Connecting to slynux.org|174.37.207.60|:80... connected. 
HTTP request sent, awaiting response... 200 OK 

Length: 15280 (15K) [text/html] 

Saving to: "index.html" 


100%[======================================>] 15,280 75.3K/s in 0.2s 
2010-08-01 07:51:21 (75.3 KB/s) - "index.html" saved [15280/15280] 
可 以 指定 从 多 个 URL 处 进行 下 载 : 


$ wget URL1 URL2 URL3 .. 





5.2.3 工作 原理 
通常 下 载 的 文件 名 和 URL 中 的 文件 名 会 保持 一 致 ， 下 载 日 志 或 进度 被 写 人 stdout。 


你 可 以 通过 选项 -o 指 定 输出 文件 名 。 如 果 存 在 同名 文件 ， 那 么 会 先 将 该 同名 文件 清空 
(truncate ) 再 写 人 人 下载 文件 。 
也 可 以 用 选项 -o 指 定 一 个 日 志文 件 ， 这 样 日 志 信息 就 不 会 被 打印 到 stdout 了 。 








$ wget ftp://example domain.com/somefile.img -0 dloaded file.img -o log 


运行 该 命令 , 屏幕 上 不 会 出 现任 何 内 容 。 日 志 或 进度 信息 被 写 人 文件 log, 输出 文件 为 dloaded fileimg。 


由 于 不 稳定 的 互联 网 连接 ,下 载 有 可 能 被 迫 中 断 。 我 们 可 以 将 重 试 次 数 作为 命令 参数 ,这 样 
一 旦 下 载 中 断 ，wget 在 放弃 之 前 还 会 继续 进行 多 次 尝试 。 


用 -~t 指 定 重 试 次 数 : 





$ wget -t 5 URL 
或 者 要 求 wget 不 停 地 进行 重 试 : 


$ wget -t 0 URL 
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5.2.4 补充 内 容 
wget 还 有 一 些 其 他 选项 ， 能 够 用 以 应 对 不 同 的 情况 。 来 看 看 其 中 的 一 部 分 。 
1. 下载 限 速 





当 我 们 的 下 载 带宽 有 限 , 却 又 有 多 个 应 用 程序 共享 互联 网 连接 时 ,进行 大 文件 下 载 往往 会 榨 
干 所 有 的 带宽 ， 严重 阻 沾 其 他 进程 。wget 命 令 有 一 个 内 建 的 选项 可 以 限定 下 载 任务 能 够 占有 的 
最 大 带宽 ， 从 而 保证 其 他 应 用 程序 流畅 运行 。 


我 们 可 以 按照 下 面 的 方式 使 用 --1imit-rate 对 wget 进 行 限 速 .; 








$ wget --limit-rate 20k http://example.com/file.iso 


在 命令 中 用 k ( 千 字 节 ) 和 m ( 兆 字 节 ) 指定 速度 限制 。 





还 可 以 指定 最 大 下 载 配额 (quota )。 配 额 一 旦 用 尽 ， 下 载 随 之 停止 。 在 下 载 多 个 文件 时 ， 对 
总 下 载 量 进行 限制 是 有 必要 的 ， 这 能 够 避免 在 无 意 中 占 用 过 多 磁盘 空间 。 


使 用 --quota 或 -Qo 选 项 : 








$ wget -Q 100m http://example.com/filel http://example.com/file2 


2. 断 点 续 传 





如 果 使 用 wget 进 行 的 下 载 在 完成 之 前 被 中 断 ， 可 以 利用 选项 -c 从 断 点 开始 继续 下 载 : 


$ wget -c URL 


3. 复制 整个 网 站 镜像 ) 








wget 有 一 个 选项 可 以 使 其 像 息 虫 一 样 以 递归 的 方式 遍历 网 页 上 所 有 的 URL 链 接 ， 并 逐个 下 
载 。 这 样 一 来 ， 我 们 就 能 够 获得 一 个 网 站 的 所 有 页 面 。 


要 实现 这 个 任务 ， 可 以 按照 下 面 的 方式 使 用 选项 --mirror: 








$ wget --mirror --convert-links exampledomain.com 
或 者 


$ wget -r -N -1 -k DEPTH URL 





-1 指定 页 面 层 级 。 这 意味 着 wget 只 会 向 下 遍历 指定 的 页 面 级 数 。 该 选项 要 与 -r ( recursive， 递归 
选项 ) 一 同 使 用 。 另 外 ，-N 表 示 使 用 文件 的 时 间 戳 。URL 表 示人 和 欲 下 载 的 网 站 起 始 地 址 。-K 或 
-convert-links 指 示 wget 将 页 面 的 链接 地 址 转换 为 本 地 地 址 。 
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对 网 站 进行 镜像 时 , 请 三 思 而 行 。 除非 你 被 许可 ,否则 只 应 出 于 个 人 使 
一 用 的 目的 才 可 以 这 么 做 ， 而 且 不 应 该 频繁 地 进行 。 

4. 访问 需要 认证 的 HTTP 或 FTP 页 面 

一 些 网 页 需要 HTTP 或 FTP 认 证 ， 可 以 用 --user 和 --password 提 供认 证 信息 : 


$ wget --user username --password pass URL 


也 可 以 不 在 命令 行 中 指定 密码 ， 而 由 网 页 提示 并 手动 输入 密码 ， 这 就 需要 将 --password 改 


为 --ask-password。 





5.3 ”以纯 文本 形式 下 载 网 页 


网 页 其 实 就 是 包含 HTML 标签 和 其 他 诸如 Javascript、CSS 等 元 素 的 HTML 页 面 。HTML 标 记 
是 网 页 的 基础 .我们 也 许 需要 解析 网 页 来 查找 特定 的 内 容 , 这 时 Bash 就 能 派 上 用 场 了 。 当 下 载 网 
页 时 ， 实 际 接收 到 的 就 是 一 个 HTML 文 件 。 这 种 格式 化 的 数据 需要 用 浏览 器 查看 。 
在 大 多 数 情况 下 ， 解 析 文本 文件 要 比 解析 HTML 数 据 来 得 容易 ， 因 为 无 需 再 去 剥离 HTML 标 
签 。Lynx 是 一 款 颇 有 玩 头 的 基于 命令 行 的 Web 浏 览 器 ,可 以 利用 它 获取 纯 文本 形式 的 网 页 。 来 看 Be 
看 这 一 切 该 如 何 实现 。 









































实战 演练 
用 1ynx 命 令 的 -dump 选 项 将 网 页 内 容 以 ASCII 编 码 的 形式 存储 到 文本 文件 中 : 
$ lynx URL -dump > webpage as text.txt 


这 个 命令 会 将 页 面 中 所 有 的 超 链接 ( <a href="1ink"> ) 作为 文本 文件 的 页 脚 ， 单 独 放置 在 标 
题 为 References 文 本 区 域 。 这 就 省 得 我 们 再 用 正则 表达 式 解析 链接 了 。 


例如 : 























$lynx -dump http://google.com > plain text page.txt 


你 可 以 用 cat 命 令 查 看 纯 文本 形式 的 网 页 : 





$ cat plain text page.txt 


5.4 cURL 入门 


作为 一 款 强 力 工 具 ，cURL 支 持 包 括 HTTP、HTTPS、FTP 在 内 的 众多 协议 。 它 还 支持 POST、 
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cookie、 认 证 、 从 指定 偏 移 处 下 载 部 分 文件 、 参 照 页 ( referer )、 用户 代 理 字符 串 、 扩 展 头 部 、 限 速 、 
文件 大 小 限制 、 进 度 条 等 特性 。 如 果 要 和 网 页 访问 序列 ( web page usage sequence ) 以 及 数据 检索 自 
动 化 打交道 ， 那 么 cURL 定 能 助 你 一 辟 之 力 。 这 则 攻略 将 为 你 展示 cURL 一 系列 最 为 重要 的 特性 。 


5.4.1 ”预备 知识 

在 默认 情况 下 ， 主 流 Linux 发 行 版 中 并 没有 包含 cURL ， 你 得 使 用 包 管 理 器 进行 安装 。 不 过 多 
数 发 行 版 都 默认 附带 了 wget。 

cURL 通常 将 下 和 载 文件 输出 到 stdqout，, 将 进度 信息 输出 到 stderr。 要 想 避 免 显 示 进 度 信 息 ， 
请 使 用 --silent 选 项 。 























证 








5.4.2 ”实战 演练 


curl 命 令 的 用 途 广 泛 ， 诸如 下 载 、 发 送 各 种 HTTP 请 求 、 指 定 HTTP 头 部 都 不 在 话 下 。 来 看 
看 cURL 如 何 做 到 这 一 切 。 


口 将 下 载 的 文件 输出 到 终端 ( 所 下 载 的 数据 被 写 信 stdout )， 使 用 下 列 命令 : 








$ curl URL 
口 要 避免 cur1 命 令 显 示 进 度 信息 ， 可 以 使 用 --silent 选 项 : 
$ curl URL --silent 


口 选项 -o 表 明 将 下 载 数据 写 入 文件 ， 而 非 标 准 输 出 中 。 该 文件 采用 的 是 从 URL 中 解析 出 的 
文件 名 : 

















$ curl URL --silent -0O 


口 如 果 需 要 在 下 载 过 程 中 显示 形 如 # 的 进度 条 ,用 --progress 人 代替 --silent。 





$ curl http://slynux.org -oo index.html --progress 
间 提 音 提 半 六 打 半 条 音 条 六 六 提 音 打 持 并 提 音 提 音 提 提 间 提 持 提 半 并 提 音 井 # 100 . 0% 


5.4.3 工作 原理 


cURL 如 果 不 将 网 页 或 文件 写 入 stdout, 就 会 将 其 写 人 和 URL 中 所 指定 的 文件 名 称 相同 的 文 
件 中 。 如 果 在 URL 中 找 不 到 文件 名 ， 则 会 产生 错误 。 因 此 要 确保 URL 指 向 的 是 远程 文件 。cuz1 
http://slynux.org -0 -silent 就 会 显示 错误 信息 ， 这 是 因为 无 法 从 URL 中 解析 出 文件 名 。 
这 种 情况 下 ， 我 们 可 以 使 用 -o 选 项 来 手动 指定 文件 名 : 


























$ curl URL --silent -o new filename 
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5.4.4 补充 内 容 

在 前 面 我 们 学 习 了 如 何 下 载 文件 以 及 将 HTML 页 面 打印 到 终端 cURL 还 包括 一 些 高 级 选项 ， 
让 我 们 接着 进行 研究 。 

1. 断 点 续 传 

cURL 能 够 从 特定 的 文件 偏 移 处 继续 下 载 。 可 以 通过 指定 一 个 偏 移 量 来 下 载 部 分 文件 。 





$ curl URL/file -C offset 


偏 移 量 是 以 字 节 为 单位 的 整数 。 如 果 只 是 想 断 点 续 传 ， 那么 cURL 不 需要 指定 准确 的 字 广 偏 
移 。 要 是 你 希望 eURL 推 断 出 正确 的 续 传 位 置 ， 请 使 用 选项 -c -， 就 像 这 样 : 








$ curl -C - URL 


cURL 会 自动 计算 出 应 该 从 哪里 开始 续 传 。 


2. 用 cURL 设置 参照 页 字符 串 





参照 页 ( referer ) "是 位 于 HTTP 头 部 中 的 一 个 字符 串 ， 用 来 标识 用 户 是 从 哪个 页 面 到 达 当 前 
页 面 的 。 如 果 用 户 点 击 了 网 页 A 中 的 某 个 链接 , 那么 用 户 就 会 转 到 网 页 B， 网 页 B 头 部 的 参照 页 字 
符 串 会 包含 网 页 A 的 URL。 


一 些 动态 网 页 会 在 返回 HTML 页 面前 检测 参照 页 字符 串 。 例 如 ， 如 果 用 户 是 通过 Google 搜 索 
来 到 了 当前 网 页 ， 网 页 上 会 附带 显示 一 个 Google 的 logo; 如 果 用 户 是 通过 手动 输入 URL 来 到 当前 
网 页 ， 则 显示 另 一 个 不 同 的 页 面 。 

网 站 的 作者 可 以 根据 条 件 进 行 判 断 : 如 果 参 照 页 是 www.google.com, 那么 就 返回 一 个 Google 
页 面 ， 和 否则 返回 其 他 页 面 。 


可 以 用 cur1 命 令 的 --referer 选 项 指定 参照 页 字符 唱 
































Ud 





$ curl --referer Referer URL target URL 
例如 : 


$ curl --referer http://google.com http://slynux.org 
3. 用 cURL 设置 cookie 


我 们 可 以 用 curl 来 指定 并 存储 HTTP 操 作 过 程 中 使 用 到 的 cookie。 











QQ referer 其 实 应 该 是 英文 单词 referrer， 不 过 拼 错 的 人 太 多 了 ， 所 以 编写 标准 的 人 也 就 将 错 就 错 了 。 
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要 指定 cookie， 使 用 --cookie "COOKIES" 选 项 。 


cookies 需 要 以 name=value 的 形式 来 给 出 。 多 个 cookie 之 间 使 用 分 号 分 隔 。 例 如 : 





$ curl http://example.com --cookie "user=slynux;pass=hack" 
如 果 要 将 cookie 另 存 为 一 个 文件 ， 使 用 --cookie-jar 选 项 。 例 如 : 


$ curl URL --cookie-jar cookie file 
4. 用 cURL 设置 用 户 代理 字符 串 


如 果 不 指 定 用 户 代理 (user agent )， 一 些 需 要 检验 用 户 代理 的 网 页 就 无 法 显示 。 你 肯定 三 
到 过 有 些 陈旧 的 网 站 只 能 在 Internet Explorer (IE ) 下 正常 工作 。 如 果 使 用 其 他 浏览 器 ， 这 些 网 
站 就 会 提示 说 它 只 能 用 IE 访问 。 这 是 因为 这 些 网 站 检查 了 用 户 代理 。 你 可 以 用 cur1 来 设置 用 户 
代理 。 


cURL 的 --user-agent 或 -A 选 项 用 于 设置 用 户 代理 : 



































$ curl URL --user-agent "Mozilla/5.0" 
其 他 HTTP 头 部 信息 也 可 以 通过 cURL 来 发 送 。 用 -H'" 头 部 信息 "传递 多 个 头 部 信息 。 例 如 : 


$ curl -H "Host: www.slynux.org" -H "Accept-language: en" URL 


中 的 一 部 分 : http://www.useragentstring.com/pages/useragentstring.php。 


| 名 类 网 页 浏览 器 和 让 下 使 用 了 很 多 不 同 的 用 户 代理 字符 囊 。 你 可 以 在 这 里 找 
> 到 共 


5. 限定 cURL 可 占用 的 带宽 





如 果 带 宽 有 限 ， 又 有 多 个 用 户 共 享 ， 为 了 平稳 流畅 地 分 享 带 宽 ， 我们 可 以 用 --1imit-rate 
限制 cURL 的 下 载 速度 : 





$ curl URL --limit-rate 20k 

在 命令 中 用 k ( 千 字 节 ) 和 m ( 兆 字 节 ) 指定 下 载 速度 限制 。 
6. 指定 最 大 下 载 量 

可 以 用 --max-filesize 选 项 指定 可 下 载 的 最 大 文件 大 小 : 


$ curl URL --max-filesize bytes 


如 果 文 件 大 小 超出 限制 ,命令 返回 一 个 非 0 的 退出 码 。 如 果 命 令 正 常 运行 ， 返 回 0。 
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7. 用 cURL 进行 认证 
可 以 用 cURL 的 选项 -u 完 成 HTTP 或 FTP 认 证 。 


-u username:password 可 用 来 指定 用 户 名 和 密码 。 它 也 可 以 不 指定 密码 ， 而 在 后 续 的 执 
行 过 程 中 按照 提示 输入 密码 。 例 如 : 





$ curl -u user:pass http://test_auth.com 

如 果 你 喜欢 经 提示 后 输入 密码 ， 只 需要 使 用 -u username 即 可 。 例 如 : 
$ curl -u user http://test_auth.com 

8. 只 打印 响应 头 部 信息 〈 不 包括 数据 部 分 ) 


只 打印 响应 头 部 (response header ) 有 助 于 进行 各 种 检查 或 统计 。 例 如 ， 如 果 要 检查 某 个 页 
面 是 否 能 够 打开 ， 并 不 需要 下 载 整个 页 面 内 容 。 只 用 读 取 HTTP 响 应 头 部 就 能 够 知道 这 个 页 面 是 
否 可 用 。 


检查 HTTP 头 部 的 一 个 用 法 就 是 在 下 载 之 前 先 获知 文件 大 小 。 我 们 可 以 在 下 载 之 前 ， 通 过 检 
查 HTTP 头 部 中 的 content-Length 参数 来 得 知 文件 的 长 度 。 同 样 还 可 以 从 头 部 检索 出 其 他 一 
些 有 用 的 参数 。Last-Modifiegd 参 数 能 告诉 我 们 远程 文件 最 后 的 改动 时 间 。 


通过 -I 或 --heaqd 就 可 以 只 打印 HTTP 尖 部 信息 ， 而 无 须 下 载 远程 文件 。 例 如 : 









































$ curl -I http://slynux.org 

HTTP/1.1 200 OK 

Date: Sun, 01 Aug 2010 05:08:09 GMT 

Server: Apache/1.3.42 (Unix) mod _ gzip/1.3.26.1a mod log bytes/1.2 mod bwlimited/1.4 
mod auth passthrough/1.8 FrontPage/5.0.2.2635 mod ssl1l/2.8.31 OpenSSL/0.9.7a 
Last-Modified: Thu, 19 Jul 2007 09:00:58 GMT 

ETag: "17787£f3-3bb0-469f284a" 

Accept-Ranges: bytes 

Content-Length: 15280 

Connection: close 

Content-Type: text/html 


5.4.5 ”参考 
参考 5.13 节 。 
5.5 ”从 命令 行 访问 Gmail 
Gmail ( http://mail.google.com ) 是 来 自 Google 的 一 项 被 广泛 使 用 的 免费 电子 邮件 服务 。 你 可 

















A 
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以 使 用 经 过 认证 的 RSS feed 来 读 取 个 人 邮件 。 我 们 也 能 够 使 用 发 件 人 姓名 以 及 邮件 主题 来 解析 


RSS feed。 这 样 便 无 须 打 开 网 页 浏览 需 就 能 够 查看 收 件 箱 中 的 未 读 


5.5.1 ”实战 演练 
来 看 下 面 这 个 脚本 文件 ， 它 的 作用 是 通过 解析 Gmail 的 RSS fee 


#!/bin/bash 
# 用 途 : 获取 Gmail 工 具 

















username='PUT_USERNAME HERE'"' 
password='PUT_PASSWORD_HERE'" 


SHOW_COUNT=5 # 需要 显示 的 未 读 邮 件数 量 


邮件 。 


d 来 显示 未 读 的 邮件 : 


echo 

curl -u $username:$password --silent "https://mail.google.com/mail/feed/atom" | \ 
tr -d '\n' | sed 's:</entry>:\n:g' |\ 

sed -n 's/.*<title>\(.*\)<\/title.*<author><name>\([^<]*\)<\/name><email> 
\([^<]*\).*/From: \2 [\3] \nSubject: \1\n/p' | \ 
head -n $(( $SHOW_COUNT * 3 )) 
输出 如 下 : 


$ ./fetch gmail.sh 
From: SLYNUX [ slynux@slynux.com ] 
Subject: Book release - 2 


From: SLYNUX [ slynux@slynux.com ] 
Subject: Book release - 1 


ee 共 5 封 未 读 邮 件 


如 果 你 的 Gmail 使 用 双重 身份 认证 ， 那 就 必须 为 出 
> 用 。 你 的 普通 密码 不 会 起 作用 。 


5.5.2 ”工作 原理 





脚本 生成 一 个 新 建 ， 并 使 


这 个 脚本 通过 用 户 认 证 来 使 用 cURL 来 下 载 RSS feed 。 用 户 认 证 信息 由 -u username: 
password 人 参数 提供 。 也 可 以 只 使 用 -u user， 这 样 就 不 用 事先 提供 密码 ， 而 是 由 cURL 在 运行 时 









































以 交互 的 方式 索要 密码 。 我 们 将 管道 命令 拆 分 成 不 同 的 部 分 来 解 和 


学 这 个 脚本 的 工作 原理 。 





tr -da '\n' 移 除了 所 有 的 换行 符 ， 这 样 我 们 就 可 以 将 \n 作 为 定 界 符 来 重建 邮件 项 。 
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sed's:</entry>:\n:g' 将 每 一 处 </entry> 替换 成 换行 符 ， 以 保证 每 一 条 邮件 项 独立 成 
行 , 以 便 逐 条 解析 邮件 ,通过 查看 https://mail.google.com/mail/feed/atom 页 面 源 代码 中 用 于 RSS feed 
的 XML 标 记 ， 我 们 可 以 看 出 每 一 条 邮件 项 都 对 应 于 <entry> TAGS </entry>。 

该 脚本 接 下 来 的 部 分 如 下 : 


sed 's/.*<title>\(.*\)<\/title.*<author><name>\([^<]*\)<\/name><email> 
NCI*S<J*N).*/Author: N2 [NV3] \nSubjects \iNn/’ 

















脚本 用 <title>\ (.*\)<\/title 匹 配 邮 件 标题 ， 用 <author><name>\([^<]*\)<\/ name> 
匹配 发 件 人 姓名 ， <email>\([^<]x*\) 匹 配 发 件 人 电子 邮件 地 址 。 然 后 使 用 反 向 引用 : 


Author: \2 [\3] \nSubject: \1\n 


用 来 将 匹配 内 容 以 易于 阅读 的 格式 来 蔡 换 原先 的 邮件 项 。\1 对 应 于 第 一 处 匹配 ，\2 对 应 于 第 二 
处 匹配 ， 依 次 类 推 。 


SHOW_COUNT=5 用 来 设置 需要 在 终端 中 显示 的 未 读 邮 件数 量 。 


head 用 来 显示 sHOW_COUNT*3" 行 文本 。sHOW_COUNT 乘 以 3 是 因为 每 一 封 未 读 邮 件 的 相关 信 
息 需 要 占用 3 行 。 











5.5.3 ”参考 


口 5.4 节 讲解 了 cur1 命 令 。 
口 4.5 节 讲解 了 seq 命 令 。 





5.6 解析 网 站 数据 


消除 不 必要 的 繁 枝 林 节 有 助 于 解析 网 页 数据 。sed 和 awk 是 完成 这 项 工作 的 主要 工具 。 在 第 4 
章 有 关 grep 的 攻略 中 ， 我 们 见 到 过 一 份 演员 评级 列表 。 那 个 列表 就 是 通过 解析 http:/www. 
johntorres.net/BoxOfficefemaleList.html 得 到 的 。 


证 我 们 看 看 如 何 使 用 文本 处 理工 具 来 解析 同样 的 数据 。 








5.6.1 实战 演练 
请 看 下 面 用 于 从 网 站 解析 演员 详细 信息 的 命令 : 
$ lynx -dump -nolist http://www.johntorres.net/BoxOfficefemaleList.html | \ 


grep -o "Rank-.*" | \ 
sed -e 's/ *Rank-\([0-9]*\) *\(.*\)/\1\t\2/' | \ 




















Q@ 这 里 的 SHOW_COUNT*3 行 文本 并 不 包括 脚本 开始 部 分 由 echo 生 成 的 那 一 行 ( 空 行 )。 
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sort -nk 1 > actresslist.txt 
输入 如 下 : 


# 由 于 版 面 空 间 限制 ， 只 显示 前 3 位 演员 的 信息 
业 Keira Knightley 
2 Natalie Portman 
3 Monica Bellucci 


5.6.2 工作 原理 

Lynx 是 一 个 基于 命令 行 的 网 页 浏览 器 。 它 并 不 会 输出 一 堆 原 始 的 HTML 代 码 ， 而 是 能 够 显示 
网 站 的 文本 版 本 ,这 个 文本 版 和 我 们 在 浏览 絮 中 看 到 的 页 面 一 模 一 样 。 这 样 一 来 ,就 免 去 了 移 除 
HTML 标 签 的 工作 。 这 里 用 到 了 1ynx 的 -nolist 选 项 , 这 是 因为 不 需要 给 每 个 链接 自动 加 上 数字 
标号 。 按 照 下 面 的 方法 用 seq 解 析 并 格式 化 以 Rank 开 头 的 行 : 

sed -e 's/ *Rank-\([0-9]*\) *\(.*\)/\I\t\2/' 


然后 再 根据 评级 情况 对 这 些 行进 行 排序 。 



































5.6.3 ”参考 


口 4.5 节 讲解 了 seq 命 令 。 
口 5.3 节 讲解 了 1ynx 命 令 。 





5.7 图 片 抓 取 器 及 下 载 工 具 


当 需 要 下 载 某 个 网 页 上 所 有 的 图 片 时 ， 图 片 抓 取 器 ( image crawler ) 能 够 帮 上 我 们 的 大 忙 。 
用 不 着 把 HTML 源 码 翻 个 底 朝 天 来 摘出 所 有 的 图 片 , 我 们 可 以 用 脚本 解析 图 像 文 件 并 将 它们 自动 
下 载 下 来 。 来 看 看 这 是 如 何 实现 的 。 




















5.7.1 实战 演练 
用 于 从 网 页 上 抓 取 并 下 载 图 片 的 Bash 脚 本 如 下 : 
#!/bin/bash 


# 用 途 :图 片 下 载 工具 
# 文 件 名 : img_downloader.sh 





if [ S$# -ne 3 ]; 

then 
echo "Usage: $0 URL -d DIRECTORY" 
exit -1 

下 于 
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pe a 二 攻 玫 到 
do 
case $1 in 
-Q) shift; directory=$1; shift ;; 
*) Url=${url:-$1}; shift;; 
esac 
done 


mkdir -p $directory; 
baseurl=$ (echo $url | egrep -o "https?://[a-z.]+") 


echo Downloading S$url 
curl -s $url | egrep -o "<img src=[^>]*>" | 
sed ‘'s/<img src=M\M"\V([~^"]*\) .*/\1/g' > /tmp/$$.1list 


sed -i "s|“^/|$baseurl/|" /tmp/$$.1list 
cd sdirectory; 

while read filename; 

do 


echo Downloading $filename 
curl -s -0 "$filename" --silent 





done < /tmp/$$.1list 


使 用 方法 : 





$ ./img downloader.sh http://www.flickr.com/search/?q=linux -d images 


5.7.2 工作 原理 


上 述 图 片 下 载 右 脚本 首先 解析 HTML 页 面 ， 除 去 <img> 之 外 的 所 有 标签 ， 然 后 从 <img> 标 
签 中 解析 出 src="URL" 并 将 图 片 下 载 到 指定 的 目录 中 。 这 个 脚本 接受 一 个 网 页 URL 和 用 于 存放 
图 片 的 目录 路 径 作为 命令 行 参 数 。 [ $# -ne 3 ] 用 于 检查 脚本 参数 数量 是 否 为 3 个 。 如 果 不 是 ， 
它 就 会 退出 运行 并 返回 脚本 用 法 说 明 。 


如 有 果 参 数 是 3 个 ， 那 么 就 解析 URL 和 目标 目录 。 实 现 方 法 如 下 : 


while [ -n "$1" ] 
do 
case $1 in 
-d) shift; directory=$1; shift ;; 
*) url=${url:-$1}; shift;; 
esac 














done 
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这 里 用 到 了 while 循 环 。 有 几 个 参数 ， 它 就 循环 几 次 。case 语 句 会 对 第 一 个 参数 ($1 ) 求 
值 ， 以 便 匹配 -a 或 是 其 他 需要 进行 检查 的 参数 。 采 用 这 种 方法 来 解析 命令 行 参数 的 好 处 在 于 ， 可 
以 将 -ad 置 于 命令 行 中 的 任意 位 置 : 




















$ ./img downloader.sh -d DIR URL 
或 者 
$ ./img downloader.sh URL -d DIR 


shift 用 来 向 左 移动 参数 。 当 使 用 shift 后 ，$2 的 值 就 被 赋 给 $1; 如 果 再 次 使 用 shift， 则 
$3 的 值 被 赋 给 $1， 往 后 依次 类 推 ， 因 此 通过 $1 就 可 以 对 所 有 的 参数 进行 求 值 。 


如 果 匹 配 -a， 显 然 接 下 来 的 参数 就 是 目标 目录 。*) 对 应 默认 匹配 ( default match )。 它 能 够 
匹配 除了 -gd 之 外 的 任何 内 容 。 因 此 在 默认 匹配 中 ， 如 果 $1="" 或 $1=URL， 就 需要 采用 $1=URL， 
避免 " "将 变量 ur1 有 覆盖 掉 ， 因 此 我 们 使 用 了 ur1=sfur1:-s1}。 如 果 ur1 不 为 空 ， 它 会 返回 URL 
值 ， 否 则 返回 $1 的 值 。 


egrep -o "<img src=[^>]*>" 只 打印 包括 属性 值 在 内 的 <img> 标签 。[^>]* 用 来 匹配 
除 > 之 外 的 所 有 字符 ， 结 果 就 是 <img src="image.jpg" .... >。 








r 






































sed 's/<img src=\"\([^"]*\).*/\1/g' 对 src="url" 进 行 解析 ， 这 样 就 可 以 从 已 经 
解析 出 来 的 <img> 标签 中 得 到 所 有 图 像 文 件 的 URL。 


图 像 文件 源 路 径 有 两 种 类 型 ， 相对 路 径 和 绝对 路 径 。 绝 对 路 径 包 含 以 http:/ 或 https:/ 起 始 的 
完整 URL， 相 对 路 径 则 以 /或 图 像 文 件 名 起 始 。 绝 对 路 径 例如 : http:/example.coryimage.jpg; 相 
对 路 径 例 如 : /image.jpg。 


对 于 以 /起 始 的 相对 路 径 ， 应 该 用 基 址 URL ( base URL ) 把 它 转换 为 http://example.com/ 
image.jpg。 我 们 一 开始 通过 解析 将 基 址 URL 存 入 变量 baseurl 中 ,然后 用 "s|^/|$baseur1l/|" 
/tmp/$$.1ist 将 所 有 的 /替换 成 baseurl。 

















"s|^/|$baseur1l/|" /tmp/$$.1ist 


while 循 环 用 来 对 图 片 的 URL 列 表 进 行 逐 行 迭代 ， 并 用 curl 下 载 图 像 文件 。 与 curl 一 同 使 
用 的 --silent 选项 可 避免 下 载 进度 信息 出 现在 屏幕 上 。 








5.7.3 ”参考 


口 5.4 节 讲解 了 cur1 命 令 。 
口 4.5 节 讲解 了 sed 命 令 。 
口 4.3 节 讲解 了 grep 命 令 。 
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5.8 网 页 相册 生成 器 


Web 开 发 人 员 通 常 都 会 为 网 站 设计 相册 页 面 ， 这 些 页 面 上 包含 着 多 个 网 像 缩 略图 。 点 击 缩 略 
图 ， 就 会 出 现 一 幅 放 大 的 图 片 。 但 如 果 需 要 很 多 图 片 ， 每 一 次 都 得 复制 <img> 标签 、 调 整 图 片 
大 小 来 创建 缩 略图 、 把 调整 好 的 图 片 放 进 缩 略 图 目录 , 诸如 此 类 的 活 儿 实在 烦琐 。 我 们 可 以 写 一 
个 简单 的 Bash 脚 本 将 这 些 重复 的 工作 以 自动 化 的 方式 来 处 理 。 这样 一 来 , 创建 缩 略 图 、 将 缩 略 图 
放 入 对 应 的 目录 、 生 成 对 应 于 <img> 标 签 的 代码 片段 都 可 以 在 短 短 几 秒 钟 内 自动 搞定 。 这 则 攻略 
正 是 要 告诉 你 如 何 实现 刚才 所 说 的 一 切 。 











5.8.1 预备 知识 


要 完成 这 项 任务 ， 可 以 通过 for 循 环 对 当前 目录 下 的 所 有 图 片 进行 迭代 。 这 需要 借助 一 些 常 
见 的 Bash 工 具 ， 如 cat 和 convert (来 自 Image Magick 软 件 包 )。 我 们 将 用 所 有 的 图 片 生成 一 个 
HTML 相 册 index.html ( 见 图 5-1 )。 








ZS Morzilla Firefox wo ww) 
FirefoxY |BO| ED | 一 fleywtmp/sfd-201Vindexhtml  @| P| 


| Wd | ® flew//mp/std2 ~ €| | 图 ~ co0e':os 省 . 加 > 个 
睛 一 LS: 
| 








一 TOOOOCI 一 


~ 
| 
| 
: 
: 


< 








名 
* 


5.8.2 ”实战 演练 
生成 HTML 相 册页 面 的 Bash 脚 本 如 下 : 
#!/bin/bash 


# 文 件 名 : generate _ album.sh 
# 用 途 : 用 当前 目录 下 的 图 片 创建 相册 
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echo "Creating album.." 
mkdir -p thumbs 

cat <<EOF1 > index.html 
<html> 

<head> 





<style> 


body 

{ 
width:470px; 
margin:auto; 
border: lpx dashed grey; 
padding:10px; 


img 
{ 
margin:5px; 
border: lpx solid black; 


} 

</style> 

</head> 

<body> 

<center><h1l> #Album title </hl></center> 
<p> 


EOF1 





for img in *.jpg; 
do 
convert "Simg" -resize "100x" "thumbs/$img" 
echo "<a href=\"$img\" ><img src=\"thumbs/$img\" title=\"$img\" /></a>" >> 
index.html 
done 





Cat <<EOF2 >> index.html 


</p> 
</body> 
</html> 
EOF2 





echo Album generated to index.html 
,一 二 此 
运行 脚本 : 


$ ./generate album.sh 
Creating album.. 
Album generated to index.html 
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5.8.3 工作 原理 
脚本 的 起 始 部 分 用 于 生成 HTML 页 面 的 头 部 。 
接 下 来 ， 脚 本 将 一 直到 EoF1 的 这 部 分 内 容 ( 不 包括 EoF1 ) 重 定向 到 index.html: 





cat <<EOF1 > index.html 
contents... 
EOF1 


页 面 头 部 包括 HTML 和 CSS 样 式 表 单 。 





for img in *.jpg; 对 每 一 个 文件 进行 迭代 ， 并 执行 相应 的 操作 。 





convert "$img" -resize "100x" "thumbs/$img" 将 创建 宽度 为 100 像 素 的 图 像 缩 略图 。 
下 面 的 语句 会 生成 所 需 的 <img> 标 记 并 将 其 追加 到 index.html 中 : 


echo "<a href=\"$img\" ><img src=\"thumbs/$img\" title=\"$img\" /></a>" >> index.html 


最 后 再 用 cat 添 加 HITML 页 脚 。 


5.8.4 ”参考 





1.6 节 讲解 了 EOF 和 stadin 重 定向 。 


5.9 Twitter 命令 行 客户 端 


Twitter 不 仅 是 最 流行 的 微 博 平台 , 同时 也 是 最 时 党 的 在 线 社 交 媒 体 。 我 们 可 以 使 用 TwitterAPI 
从 命令 行 中 读 取 自 己 发 布 的 微 博 。 来 看 看 如 何 实现 。 





5.9.1 预备 知识 


最 近 Twitter 已 经 不 再 允许 用 户 使 用 普通 的 HTTP 认 证 (plain HTTP Authentication ) 进行 登录 
了 ， 我 们 必须 使 用 OAuth 进 行 自 认证 (authenticate ourselves )。 完 整地 讲解 OAuth 超 出 了 本 书 的 范 
围 ， 因 此 我 们 会 利用 一 个 代码 库 以 便 在 Bash 脚 本 中 可 以 轻松 使 用 OAuth。 











(1) 从 https://github.conylivibetter/bash-oauth/archive/master.zip 人 处 下 载 bash-oauth 库 ， 将 其 
解压 缩 到 任意 目录 中 。 


(2) 进入 该 目录 中 的 bpash-oauth-master 子 目录 ， 以 root 身 份 执行 make install-all。 


(3) 进入 https://dev.twitter.com/apps/new 注 册 新 的 应 用 ， 以 便 能 够 使 用 OAuth， 如 图 5-2 所 示 。 











画 信 Create an application | TwitterDevelopars- Mozila Firefox CS 
1 h pting | titte.. @ | ¥ Create an application | Twitter @ [Ea 


~@| ll 和 %* 售 园 v- 人 ~ 












Home = My applications 


Create an application 


Application Details 


Name:* 
shellscriptingcookbook 


Your application name This is used to arribure the sourcs of a tweet and in User-facing authorization screens 32 characters max 


Description: * 
shellscriptingcookbook 


Your application description, which Wi be shown in user-facing aufhorization screens. Batween 10 and 200 eharacters max 


Website: * 
http:www-shantanutusharcom 


Your application's publicly accessible home page, Where users can yo to downioad,make UsEof or find our moreinformalion abour your appliceril 
Source artribution for tweets crealed by your application and wil be shown im user-facing aunhorization screers 


a 





图 5-2 


(4) 注册 完 新 的 应 用 之 后 , 进入 应 用 设置 , 将 Access type 更 改 为 Read and Write, 如 图 5-3 
所 示 。 





[ shellscriptingcookbook | Twitter Developers - Mozilla Firefox Ww 
Firefoxv [EAE | » shelscriptingcookbook | wite.. @| | 
二 ei | @ https/devtwitter.com/apps/3923534/set ~v @ 








Application Icon 


Change icon: 


Maximum siz= of700k JPG, GIF, PNG: 


Application Type 


Acce: 
Read only 


,~ Read and Write 


他) Read, Wiite and Access direct messages 


War type of access does your application need? Nare: @Anywhere applicationa Tequire rear & wrie access 
Find out more about our Application Permission Madel 


Callback URL: 


Where should we return after successfuly authenticating? For @ Anywhers applications, only the domain spacified In the callback wil be used 口 
specify their oaut h_callback URL orihe request token step, regardess of the vale given here. To resiriot your application from using calbarc SS 


KE 一 于 
a 
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(5) 进入 应 用 的 Details 部 分 ,注意 两 个 地 方 : Consumer Key 和 Consumer Secret， 以 便 在 脚 
本 中 对 其 进行 替换 ， 如 图 5-4 所 示 。 





轧 沪 shellscriptingcookbook | Twitter Developers- Mozilla Firefox SE 
Firefoxv J 呈 [本 | 等 shellscriptingcookbook | Twitte... @ [过 | 


二 We | @ hapswdevtwittercom/ap 3934/shc 








等 Developers ER 


Read, write, and direct messages 
About the application permission model 


Consumer secret 

Request token URL https://api .twitter.com/oauth/request token 
https://api.twitter.com/oauth/authorize 
https://api., twitter,com/oauth/access_token 


None 


our access token 


lt looks like you haven't authorized this application for your own Twitter ac count yet. For your convenience, we give you the opp 
oken here, so you can start signing your requests right away, The access token generated Will reflect your applic ation's curren 











好 ， 接 下 来 就 该 编写 脚本 了 。 


5.9.2 ”实战 演练 
接 下 来 编写 使 用 代码 库 的 Bash 脚 本 : 


#1!/bin/bash 
# 文 件 名 : twitter.sh 
# 用 途 :twitter 客 户 广 基本 版 


oauth_ consumer_key=YOUR_CONSUMER_KEY 
oauth consumer_secret=YOUR_ CONSUMER_ SECRET 
config_ file=~/.S$Soauth consumer key-$oauth consumer_ secret-rc 


if [[ "$1" != "read" ]] && [[ "$1" != "tweet" ]]; 
then 
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echo -e "Usage: $0 tweet status message\n OR\n $0 read\n" 
exit -1; 
pg 


source TwitterOAuth.sh 
TO_init 


If [ ! -e $config _ file ]; then 
TO_access_token helper 
jE (i( SP a0 )) 3. then 
echo oauth token=${TO_ret[0]} > $config_ file 
echo oauth token secret=${TO_ ret[1]} >> $config file 
下 
下 水 


Source Sconfig_ file 


if [[ "$1" = "read" 1]]; 
then 
TO_statuses_ home timeline '' 'shantanutushar' '10' 
echo $TO ret | sed 's/<\([a-z]\)/\n<\1l/g' | \ 
grep -e '^<text>' -e '^<name>' | sed 's/<name>/\ - by /g' | \ 


sed 's$</*[a-z]*>$$g' 


elif [[ "$1" = "tweet" ]]; 
then 
shift 
TO_statuses_ update '' "$Q@" 
echo 'Tweeted :)' 
主 主 
运行 脚本 : 


$./twitter.sh read 
Please go to the following link to get the PIN: 
https://api.twitter.com/oauth/authorize?oauth token=GaZcfsdnhMO4HiBQuUTdeLJAzeaUam 
noljWwGnU 
PIN: 4727143 
Now you can create, edit and present Slides offline. 
- by A Googler 
$./twitter.sh tweet "I am reading Packt Shell Scripting Cookbook" 
Tweeted :) 
$./twitter.sh read | head -2 
I am reading Packt Shell Scripting Cookbook 
- by Shantanu Tushar Jha 
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5.9.3 工作 原理 


首先 , 使 用 source 命 令 将 TwitterOAuth.sh 库 包含 在 脚本 中 , 这 样 就 可 以 利用 其 中 定义 好 的 函 
数 访问 Twitter 了 。 我 们 需要 调用 库 函 数 ro_init， 以 便 库 完 成 自身 的 初始 化 操作 。 


所 有 的 应 用 在 用 户 首次 使 用 的 时 候 都 需要 获取 一 个 OAuth 令 牌 (token ) 以 及 令 牌 密 钥 (token 
secret )。 我 们 需要 检查 是 否 已 经 获取 。 如 果 没 有 ， 则 调用 库 函 数 ro_access_token_helper。 
得 到 之 后 ， 将 其 保存 在 config 文 件 中 ， 以 后 再 执行 脚本 时 ， 只 需 对 该 文件 执行 source 命 令 就 可 
以 了 。 


我 们 使 用 库 函 数 rTo_statuses_home_timeline 获 取 Twitter 中 发 布 的 内 容 ， 该 函数 会 读 
取 Twitter ， 将 得 到 的 XML 文件 内 容 存 人 变量 ro_ret ， 然 后 使 用 sed 为 每 一 个 标签 (tag ) 加 上 
一 个 换行 符 ， 过 滤 出 <text> 和 <name> 标 签 ， 最 后 再 将 这 些 标签 删除 ， 蔡 换 成 便于 用 户 阅 读 的 
文本 。 

要 发 布 新 的 微 博 ， 可 以 使 用 库 函 数 ro_statuses_update。 如 果 该 函数 的 第 一 个 参数 为 空 ， 
则 表明 使 用 默认 格式 ， 要 发 布 的 内 容 可 以 作为 第 二 个 参数 传递 给 函数 。 




















5.9.4 ”参考 


口 5.4 节 讲解 了 seq 命 令 。 
口 4.3 节 讲解 了 grep 命 令 。 





5.10 ”基于 Web 后 端的 定义 查询 工具 

网 上 有 大 量 提供 了 API 的 词典 工具 ， 利用 这 些 API 可 以 获得 能 被 机 器 读 取 ( machine-readable ) 
的 词汇 定义 。 让 我 们 来 使 用 其 中 的 一 种 API 来 编写 一 个 词汇 定义 查询 脚本 。 
5.10.1 预备 知识 


我 们 用 curl、sed 和 grep 来 编写 词汇 查询 工具 。 有 关 词 典 的 网 站 数不胜数 ， 你 可 以 注册 并 
免费 使 用 它们 的 API ( 限于 个 人 用 途 )。 在 这 里 ,我 们 使 用 Merriam-Webster 的 词典 API。 请 按照 下 
列 步骤 执行 。 

















(1) 进入 http://www.dictionaryapi.com/register/index.htm 注 册 账 户 。 选 择 Collegiate Dictionary 
和 Learners Dictionary， 如 图 5-5 所 示 。 











芳和 Merriam-Webster Developer Center- Mozilla Firefox ly 
Firefoxv IT © Merriam-Webster Developer Ce... © [Ee 


春之 Ee 三 wwwdictionaryapicomWreslscerindexhor ~ @ 图 














BETA 


) Developer Center 


Home » Products * Branding Guidelines 。 Frequently Asked Questions 


Sign In Register 


Welcome! Please Register 


i Developer API Account Registration 


Email: Welcome to Merriam-Websters Developer Center! If this is your first time her' 
the form below. Allfields are required. After you submit your registration, a verific: 
Password: you. Please follow the instructions in that e-mail to complete your registration and 


Sign In First Name: 





LastName: 





E-mai 





4 This will be your login, and 


e-mail will be sent to this al 
Confirm E-mail: 








图 5-5 


(人 C) 使 用 新 创建 的 用 户 登 录 ， 进 入 My Keys 获 取 密 钥 。 记 下 Leamer’s Dictionary 的 密 钥 ， 


如 图 $-6 所 示 。 





图 祠 Merriam Webster Developer Center- Mozilla Firefox SH 
Firefoxv [SI]|S weremwebster Developer Ce,. @ 民权 


二 |B wwdictonaryapicom/accouni/myleyshtm v@ 图 ~ s 


SN BETA | 
Developer Center 































Home 。 Products 。 Branding Guidelines 。 Frequently Asked Questions 


Account Info 


My Account 


b My Account My Keys 


Ek EditProfie 
» Monthly Usage Reports Key (Dictionary): 





» MykKeys Key (Learners): 


® 2013 Merriam-Websier ncorporated * PrivacyPolicy * Terms ofService » ContactUs 
Merriam Webster Online 。 Learner's Dictionary « Word Cenval 


加 和 
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5.10.2 ”实战 演练 
来 看 下 面 这 段 定义 工具 脚本 : 
#!/bin/bash 
# 文 件 名 : aefine .sh 


# 用 途 : 用 于 从 dictionaryapi .com 获取 词汇 定义 


apikey=YOUR_API_KEY_HERE 














if [ $# -ne 2 ]; 

then 
echo -e "Usage: $0 WORD NUMBER" 
exit -1; 

EE 





curl --silent 
http://www.dictionaryapi.com/api/vl/references/learners/xml/$1l?key=$apikey | \ 
grep -oO \<dt\>.*\</dt\> | \ 


sed 's$</*[a-z]*>$$g' | \ 
head -n $2 | nl 
运行 脚本 : 


$ ./define.sh usb 1 Er 


1 :a system for connecting a computer to another device (such as a printer, 





keyboard, or mouse) by using a special kind of cord a USB cable/port USB is an 
abbreviation of "Universal Serial Bus."How it works... 


5.10.3 ”工作 原理 


我 们 通过 指定 API key ( $apikey ) 来 使 用 cur1 从 词典 API 页 面 获取 数据 以 及 需要 查找 定义 
的 词汇 ( $1 )。 包含 定义 的 查询 结果 位 于 <tag> 标 签 中 , 可 以 使 用 grep 来 将 其 选中 , 然后 使 用 sea 
删除 标签 。 接 着 从 定义 中 提取 所 需要 的 行 数 ， 利 用 n1 在 行 前 加 上 行 号 。 











5.10.4 ”参考 


口 4.5 节 讲解 了 seq 命 令 。 
口 4.3 节 讲解 了 grep 命 令 。 





5.11 查找 网 站 中 的 无 效 链 接 
一 些 人 采用 人 工 方式 来 检查 网 站 上 的 每 一 个 页 面 ,以 便 找 出 无 效 的 链接 。 这 对 于 页 面 不 多 的 
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小 网 站 来 说 还 算 可 行 。 但 是 随 着 页 面 数量 增多 ,这 种 方式 就 不 现实 了 。 要 是 能 够 将 查找 无 效 链 接 
的 工作 自动 化 ， 那 可 就 轻松 太 多 了 。 我 们 可 以 利用 HITP 处 理工 具 来 查找 无 效 的 链接 。 来 看 看 这 

















是 怎样 实现 的 。 
5.11.1 预备 知识 


要 识别 链接 并 从 中 找 出 无 效 链接 ， 我们 可 以 使 用 lynx 和 curl。1lynx 有 一 个 选项 
-traversal, 能 够 以 递归 方式 访问 网 站 页 面 并 建立 网 站 中 所 有 超 链接 的 列表 。 我 们 可 以 用 curl 
验证 每 一 个 链接 的 有 效 性 。 


5.11.2 


利 月 


#1!1/ 





实战 演练 


有 cur1 查 找 网 页 上 无 效 链接 的 Bash 脚 本 如 下 : 


bin/bash 





# 文 


件 名 : fing_broken.sh 


# 用 途 : 查找 网 站 中 的 无 效 链接 


了 
the: 
e 
e 
王 主 


ech 


mkd 
cd 


lyn 
Cou 


Sor 


whi 

do 
O 
于 
t 


fj 


[el 

n 

cho -e "SUsage: $0 URL\nN" 
于 蕊 


oO Broken links: 


ir /tmp/$$.lynx 
/tmp/$$.lynx 


x -traversal $1 > /dev/null 
nt=0; 


t -u reject.dat > links.txt 
le read link; 


utput=“curl -I $link -s | grep "HTTP/.*OK".; 
f [[ -z $output ]]; 

hen 

echo S$link; 

let count++ 

1 


done < links.txt 


[ $ 


count -eq 0 ] && echo No broken links found. 
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5.11.3 ”工作 原理 


lynx -traversal URL 会 在 工作 目录 下 生成 数 个 文件 ， 其 中 包括 reject .dat， 该 文件 包 
含 网 站 中 的 所 有 链接 。sort -u 用 来 建立 一 个 不 包含 重复 项 的 列表 。 然 后 我 们 迭代 每 一 个 链接 ， 
并 通过 cur1 -I 检验 接收 到 的 响应 头 部 。 如 果 啊 应 头 部 的 第 一 行 包含 HTTP/1.0 200 OK， 就 表 
示 该 链接 正常 。 显 示 其 他 响应 信息 则 表示 该 链接 失效 ， 并 将 其 输出 到 屏幕 。 














从 名 称 上 来 看 , reject.dat 中 包含 的 应 该 是 无 效 URL 的 列表 ,但 其 实 并 非 如 此 ， 
lynx 是 将 所 有 的 URL 全 都 放 到 了 这 个 文件 中 。 
lynx 还 生成 了 一 个 名 为 traverse.errors 的 文件 ， 其 中 包含 了 所 有 在 浏览 过 程 中 
一 存在 问题 的 URL。 ne et 会 将 返回 HTTP 404(not found) 的 URL， 因 此 会 遗漏 
那些 存在 其 他 类 型 错误 的 URL (例如 HTTP 403 Forbidden ) 。 这 就 是 为 什么 要 手 
动 检查 返回 状态 的 原因 。 


5.11.4 ”参考 


口 5.3 节 讲解 了 1ynx 命 人 
口 5.4 节 讲解 了 cur1 命 人 





心 少 





5.12 ”跟踪 网 站 变动 


对 于 Web 开 发 人 员 和 用 户 来 说 ， 跟 踪 网 站 的 变动 情况 不 无 益处 。 但 定期 手动 检查 既 麻 烦 也 不 
现实 ， 因 此 ， 我 们 可 以 编写 一 个 定期 运行 的 变动 跟踪 需 〈change tracker )。 一旦 发 生变 动 ， 跟 踩 
器 便 会 发 出 声音 或 发 送 提示 信息 。 下 面 看 一 看 如 何 编写 基础 的 网 站 变动 跟踪 需 。 








5.12.1 预备 知识 





用 Bash 脚 本 跟踪 网 站 变动 意味 着 要 在 不 同 的 时 间 检 索 网 站 ， 然 后 用 diff 命令 进行 比 对 。 我 
们 可 以 使 用 cur1 和 aiff 来 实现 。 





5.12.2 ”实战 演练 


结合 各 种 命令 来 跟踪 网 页 变更 的 Bash 脚 本 如 下 : 
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#!/bin/bash 
# 文 件 名 : change_track.sh 
# 用 途 : 跟踪 网 页 更 新 


if [ S$# -ne 1 1]; 

then 
echo -e "SUsage: $0 URL\nNn" 
exit 1; 

Ea 


first_time=0 


# 非 首次 运行 


If [ ! -e "last.html" ]; 
then 

first time=1 

# 首 次 运行 
玉生 


curl --silent $1 -o recent.html 


if [ $first time -ne 1 ]; 


then 
changes=$ (diff -u last.html zecent .html) 
if [ -n "$changes" ]; 
then 


echo -e "Changes:\n" 
echo "$changes" 
else 
echo -e "\nWebsite has no changes" 
Ea 
else 
echo "[First run] Archiving.." 


平 下 


cp recent .html last.html 
分 别 观察 一 下 网 页 发 生变 动 与 没有 变动 时 脚本 track_changes.sh 的 输出 。 


口 第 一 次 运行 








$ ./track changes.sh http://web.sarathlakshman.info/test.html 
[First run] Archiving.. 


口 第 二 次 运行 : 





$ ./track changes.sh http://web.sarathlakshman.info/test.html 
Website has no changes 
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口 在 网 页 变动 后 ， 第 三 次 运行 : 





$ ./test .sh http://web.sarathlakshman.info/test change/test.html 
Changes: 


--- last.html 2010-08-01 07:29:15.000000000 +0200 


+++ recent.html 2010-08-01 07:29:43.000000000 +0200 
@@ -1,3 +1,4 @@ 

<html> 

+added line :) 

<p>data</p> 

</html> 


5.12.3 ”工作 原理 








脚本 用 [ ! -e "1last.html" ]; 检查 自己 是 否 是 首次 运行 。 如 果 1ast .html 不 存在 ， 那 就 
意味 着 这 是 首次 运行 ， 因 此 要 下 载 网 页 并 将 其 复制 为 last .html。 


如 果 不 是 第 一 次 运行 , 那么 脚本 应 该 下 载 一 个 新 的 网 页 副本 ( recent .html ), 然后 用 diff 
检查 差异 。 如 果 有 变化 ， 则 打印 出 变更 信息 并 将 recent .html 复 制 成 last .html。 


5.12.4 ”参考 Ee 


5.4 节 讲解 了 cur1 命 令 。 

















5.13 以 POST 方式 发 送 网 页 并 读 取 响应 








POST 和 GET 是 HTTP 协 议 中 用 于 发 送 或 检索 信息 的 两 种 请 求 类 型 。 在 GET 请 求 方式 中 , 我们 
利用 网 页 的 URL 来 发 送 参数 (名称 - 值 )。 而 在 POST 请 求 方式 中 ， 就 不 是 这 样 了 。POST 方 式 用 于 
提交 表单 。 例 如 提交 用 户 名 、 密 码 以 及 检索 登录 页 面 等 。 


当 编 写 基于 网 页 检索 的 脚本 时 ， 用 POST 方式 发 送 页 面 很 常见 。 让 我 们 来 看 一 看 POST 的 使 用 


方法 。 在 编写 解析 网 站 数据 的 shell 脚 本 的 过 程 中 ， 通 过 POST 方式 发 送 数据 并 检索 输出 结果 来 实 
现 HTTP GET 和 POST 请 求 自 动 化 ， 是 一 项 非常 重要 的 任务 。 




















5.13.1 预备 知识 





这 里 我 们 使 用 了 一 个 测试 网 站 (http://book.sarathlakshman.com/lsc/mlogs/ ) 来 提交 当前 的 用 
户 信 息 , 如 主机 名 和 用 户 名 。 在 网 站 主页 上 有 两 个 文本 域 :HOSTNAME 和 USER 以 及 一 个 SUBMIT 
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按钮 。 当 用 户 输入 主机 名 和 用 户 名 ,点 击 SUBMIT 按 钮 后 ， 信 息 会 被 存储 在 网 站 中 。 这 个 过 程 可 
以 使 用 一 行 curl (或 wget ) 自动 化 POST 请 求 来 实现 。 来 看 看 具体 的 做 法 。 








5.13.2 ”实战 演练 








使 用 cur1 发 送 POST 请 求 并 读 取 网 站 的 响应 (HTML 格式 ): 
$ curl URL -d "postvar=postdata2&postvar2=postdata2" 
例如 : 


$ curl http://book.sarathlakshman.com/lsc/mlogs/submit .php -d 
"host=test-host&user=slynux" 

<html> 

You have entered : 

<p>HOST : test-host</p> 

<p>USER : slynux</p> 

<html> 


cur1 会 打印 出 响应 页 面 。 


-q 表 示 以 POST 方式 提交 用 户 数据 。-q 的 字符 串 参 数 的 形式 类 似 于 GET 请 求 。 每 对 
var=value 之 间 用 & 分 隔 。 


也 可 以 利用 wget， 使 用 它 的 -post-aata \string" 来 提交 数据 。 例 如 : 





$ get http://book.sarathlakshman.com/lsc/mlogs/submit .php --post-data 
"host=test-host&user=slynux" -0O output.html 

$ cat output.html 

<html> 

You have entered : 

<p>HOST : test-host</p> 

<P>USER : slynux</p> 

<html> 


“名 称 - 值 ”组 合 的 格式 同 cURL 中 的 一 样 。 


Ka -d 参 数 的 内 容 应 该 以 引用 的 形式 给 出 。 否则 ，& 会 被 shell 解 读 为 该 命令 需要 
作为 后 台 进 程 运行 。 


5.13.3 ”工作 原理 





如 果 你 查看 网 站 的 源 代 码 (使 用 网 页 浏览 器 的 查看 源 代码 选项 )， 你 会 发 现 一 个 与 下 面 类 似 
的 HTML 表 单 ， 
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<form action="http://book.sarathlakshman.com/lsc/mlogs/submit.php" method="post" > 


<input type="text" name="host" value="HOSTNAME" > 
<input type="text" name="user" value="USER" > 
<input type="submit" > 

</form> 





其 中 http://book.sarathlakshman.com/lsc/mlogs/submit.php 是 目标 URL。 当 用 户 输 
入 信息 并 点 击 SUBMIT 按 钮 时 ， 主 机 名 和 用 户 名 就 以 POST 请 求 的 方式 被 发 送 到 submitphp 中 ， 然 
后 对 应 的 啊 应 页 面 被 返回 到 浏览 器 。 


5.13.4 ”参考 


口 5.4 节 讲解 了 cur1 命 
口 5.2 节 讲解 了 wget 命 


口 





令 
令 


[e) 
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本 章 内 容 


口 用 tar 归 档 

口 用 cpio 归 档 

口 用 gzip 压 缩 数据 

口 用 zip 归 档 和 压缩 

口 更 快速 的 归档 工具 pbzip2 





6.1 简介 














口 创建 压缩 文件 系统 

口 用 raync 备 份 系统 快照 

口 用 Git 进 行 基于 版 本 控制 的 备份 
口 用 fsarchivez 创 建 全 盘 镜 像 








提取 快照 和 备份 数据 都 是 我 们 的 日 常 工作 , 就 服务 器 或 大 型 数据 存储 系统 而 言 , 定期 备份 更 

















是 不 可 小 视 。shell 脚 本 是 实现 备份 自动 化 最 简单 的 方法 之 一 ， 如 果 不 能 实现 自动 化 ,备份 的 用 处 
就 大 打折 扣 了 。 采 用 各 种 压缩 方式 也 值得 一 坛 , 这 样 我 们 便 能 够 减少 备份 文件 的 体积 。 加 密 是 另 








一 种 保护 数据 的 常用 方法 。 为 了 减少 加 密 数 据 的 大 小 , 文件 在 加 密 之 前 通常 都 要 移 进行 归档 和 压 
缩 。 有 很 多 标准 加 密 算 法 可 以 使 用 , 而 且 也 都 有 相应 的 shell 工 具 。 本 章 包含 了 这 方面 的 各 类 攻略 ， 
包括 创建 和 维护 文件 或 文件 夹 归档 、 压 缩 格 式 以 及 加 密 技 术 。 接 下 来 让 我 们 看 看 这 些 内 容 。 





6.2 用 taz 归档 


tar 命 令 可 以 对 文件 进行 归档 。 它 最 初 是 设计 用 来 将 数据 存储 在 磁带 上 。tar 可 以 将 多 个 文 
件 和 文件 夹 保 存 为 单个 文件 ， 同 时 还 能 保留 所 有 的 文件 属性 ， 如 所 有 者 、 权 限 等 。 由 tar 创 建 的 











文件 通常 称 为 Tarball。 在 这 则 攻略 里 ， 我 们 } 


6.2.1 预备 知识 





各 学 习 如 何 使 用 Far 归 档 。 


所 有 Unix 类 操作 系统 中 都 默认 包含 tar 命 令 。 它 语法 简单 ， 文 件 格式 具备 可 移植 性 。tar 支 
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持 的 参数 包括 : A、c、d、r、u、x、f 和 v。 其 中 每 一 个 参数 都 可 以 依据 不 同 的 用 途 单 独 使 用 。 


6.2.2 ”实战 演练 
我 们 可 以 使 用 tar 创 建 归档 文件 ， 对 已 有 的 归档 文件 进行 操作 。 
(1) 用 tar 对 文件 进行 归档 : 
$ tar -cf output.tar [SOURCES] 
例如 : 
$ tar -cf output.tar filel file2 file3 folderl .. 
(2) 使 用 选项 -t 列 出 归档 文件 中 所 包含 的 文件 : 


$ 七 ar -tf archive.tar 
filel 
file2 

(3) 如 果 需 要 在 归档 或 列 出 归档 文件 列表 时 获知 更 多 的 细节 信息 ， 可 以 使 用 -v 或 -vv 参 
数 。 这 个 特性 叫做 “ 宛 长 模式 ”( verbose )， 对 于 大 多 数 命令 而 言 ， 该 模式 会 在 终端 
中 输出 更 多 的 细节 。 例 如 ， 利 用 宛 长 模式 ， 你 可 以 得 到 诸如 文件 权限 、 所 有 者 所 属 
的 分 组 、 文 件 修 改 日 期 等 信息 。 





$ tar -tvf archive.tar 
-rw-rw-r-- shaan/shaan 0 2013-04-08 21:34 filel 
-rw-rw-r-- shaan/shaan 0 2013-04-08 21:34 file2 


文件 名 必须 紧 跟 在 -f 之 后 ， 而 且 -f 应 该 是 选项 中 的 最 后 一 个 。 
假如 你 希望 使 用 宛 长 模式 ， 那 就 应 该 像 这 样 使 用 ， 


$ tar -cvf output .tar filel file2 file3 folderl .. 


6.2.3 工作 原理 
命令 中 的 -c 代 表 “ 创 建文 件 ”( creat file )，-E 代 表 “ 指 定 文件 名 ”( specify filename )。 


我 们 可 以 在 SoURCE 处 指定 目录 或 文件 名 。 也 可 以 使 用 文件 名 列表 或 者 诸如 * .txt 这 类 通 配 
符 来 指定 。 命令 执行 完毕 后 ， tar 会 将 源 文件 归档 为 output .tar。 

不 能 传递 上 百 个 文件 或 文件 夹 作为 tar 的 参数 ， 毕 竞 参 数 数量 不 是 无 限制 的 。 如 果 有 很 多 
文件 需要 归档 ， 那 么 使 用 追加 选项 ( 详 见 下 文 ) 要 更 安全 些 。 
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6.2.4 补充 知识 
让 我 们 再 来 看 看 tar 命令 的 其 他 特性 。 
1. 向 归档 文件 中 添加 文件 
有 时 候 ， 我 们 可 能 需要 向 已 存在 的 归档 文件 再 添加 一 些 文件 ， 这 时 可 以 使 用 追加 选项 -r。 
要 向 已 有 的 归档 文件 中 添加 一 个 文件 : 








$ tar -rvf original.tar new file 
创建 一 个 其 中 包含 有 文本 文件 的 归档 : 
$ tar -cf archive.tar hello.txt 

用 下 面 的 方法 列 出 归档 文件 中 的 内 容 : 


$ tar -tf archive.tar 
hello.txt 


接着 向 归档 文件 中 再 添加 另 一 个 文件 ， 并 列 出 归档 内 容 : 
$ tar -rf archive.tar world.txt 
$ tar -tf archive.tar 


hello.txt 
world.txt 


这 个 归档 文件 中 现在 包含 了 两 个 文件 。 
2. 从 归档 文件 中 提取 文件 或 文件 夹 
下 面 的 命令 将 归档 文件 的 内 容 提取 到 当前 目录 中 : 
$ tar -xf archive.tar 

选项 -x 表示 提取 (exact )。 


使 用 -x 时 ,tar 命令 将 归档 文件 中 的 内 容 提 取 到 当前 目录 。 我 们 也 可 以 用 选项 -c 来 指定 需要 
将 文件 提取 到 哪个 目录 : 








$ tar -xf archive.tar -C /path/to/extraction directory 


这 个 命令 将 归档 文件 的 内 容 提取 到 指定 目录 中 。 它 提取 的 是 归档 文件 中 的 全 部 内 容 。 我 们 可 以 通 
过 将 文件 名 指定 为 命令 行 参数 来 提取 特定 的 文件 : 


$ tar -xvf file.tar filel file4 


上 面 的 命令 只 提取 filel1 和 file4， 和 忽略 其 他 文件 。 
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3. 在 tar 中 使 用 stain 和 stdout 

进行 归档 时 ， 我们 可 以 将 staout 指 定 为 输出 文件 ， 这 样 男 一 个 命令 就 可 以 通过 管道 来 读 取 
(作为 stain )， 然 后 进行 其 他 处 理 或 提取 内 容 。 

当 通 过 安全 shell ( Secure Shell，SSH ) 连接 传输 数据 时 ， 这 招 很 管用 。 例 如 : 

$ tar cvf - files/ | ssh user@example.com "tar xv -C Documents/" 

在 上 面 的 例子 中 ， 对 files 目 录 中 的 内 容 进 行 了 归档 并 输出 到 stdout ( 由 '-' 指 明 )。 

4. 拼接 两 个 归档 文件 

我 们 可 以 用 -A 选项 轻松 地 合并 多 个 tar 文 件 。 

假设 我 们 现在 有 两 个 tar 文 件 : filel.tar 和 file2.tar。 可 以 按照 下 面 的 方法 将 file2.tar 的 内 容 合 3 
到 filel.tar 中 : 

$ tar -Af filel.tar file2.tar 

查看 内 容 ， 验 证 操作 是 否 成 功 : 

$ tar -tvf filel.tar 

5. 通过 检查 时 间 戳 来 更 新 归档 文件 中 的 内 容 


添加 选项 可 以 将 指定 的 任意 文件 加 入 到 归档 文件 中 。 如 果 同 名 文件 已 经 存在 , 那么 结果 就 是 
在 归档 文件 中 包含 了 两 个 同名 的 文件 。 我 们 可 以 用 更 新 选项 -u 指 明 : 只 有 比 归 档 文件 中 的 同名 文 
件 更 新 时 才 会 被 添加 。 








$ tar -tf archive.tar 
filea 
fileb 
filec 


上 面 的 命令 将 列 出 归档 文件 中 的 内 容 。 
仅 当 flea 自 上 次 被 加 入 archive.tar 后 出 现 了 变动 才 对 其 进行 追加 ， 可 以 使 用 : 





$ tar -uf archive.tar filea 
如 果 两 个 filea 的 时 间 戳 相同 ， 则 什么 都 不 会 发 生 。 
可 用 touch 命 令 修 改 文件 的 时 间 戳 ， 然 后 再 用 ar 命令 : 


$ tar -uvvf archive.tar filea 
-rw-r--r-- slynux/slynux 0 2010-08-14 17:53 filea 
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因为 时 间 戳 比 归档 文件 中 的 同名 文件 更 新 ， 因 此 执行 追加 操作 。 验 证 如 下 : 





$ tar -tf archive.tar 

0 2010-08-14 17:52 filea 

-rw-r--r-- slynux/slynux 0 2010-08-14 17:52 fileb 

-rw-r--r-- slynux/slynux 0 2010-08-14 17:52 filec 
0 2010-08-14 17:53 filea 


-rw-r--r-- slynux/slynux 


-rw-r--r-- slynux/slynux 


如 你 所 见 ， 一 个 新 的 名 ea 被 加 入 了 归档 文件 中 。 当 从 中 提取 文件 时 ，taz 会 挑选 最 新 的 flea 进 行 
提取 。 


6. 比较 归档 文件 与 文件 系统 中 的 内 容 


有 时 候 需 要 知道 归档 文件 中 的 文件 与 文件 系统 中 的 同名 文件 是 否 相 同 。 选 项 -a 可 以 打印 出 两 
者 之 间 的 差别 : 





$ tar -df archive.tar 
afile: Mod time differs 
afile: Size differs 


7. 从 归档 文件 中 删除 文件 
我 们 可 以 用 --delete 选 项 从 给 定 的 归档 文件 中 删除 文件 。 例 如 : 
$ tar -f archive.tar --delete filel file2 .. 
或 者 
$ tar --delete --file archive.tar [FILE LIST] 


来 看 另外 一 个 例子 : 





$ tar -tf archive.tar 
filea 
fileb 
filec 


删除 filea: 


$ tar --delete --file archive.tar filea 
$ tar -tf archive.tar 

fileb 

filec 


8. 压缩 tar 归 档 文件 

tar 命 令 只 能 用 来 对 文件 进行 归档 ， 它 并 不 具备 压缩 功能 。 出 于 这 个 原因 ， 多 数 用 户 在 使 用 
归档 文件 时 都 会 对 文件 采用 某 种 形式 的 压缩 ,这 样 就 能 够 显著 减少 文件 的 体积 。 归 档 文件 通常 被 
压缩 成 下 列 格式 之 一 : 
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DQ file.tar.gz 
DQ file.tar.bz2 





DQ file.tar.lzma 
不 同 的 tar 选 项 可 以 用 来 指定 不 同 的 压缩 格式 : 


口 -j 指 定 bunzip2 格 式 ; 
口 -z 指 定 gzip 格 式 ; 
口 --1zma 指 定 lzma 格 式 。 


这 些 格式 会 在 随后 专门 讲解 压缩 技术 的 攻略 中 讨论 。 


也 可 以 不 明确 指定 上 面 那些 特定 的 选项 来 使 用 压缩 功能 。tar 能 够 通过 查看 输出 或 输入 文件 
的 扩展 名 来 进行 压缩 。 为 了 让 tar 支 持 根 据 扩 展 名 自动 进行 压缩 ， 使 用 -a 或 --auto-compress 
选项 : 











$ tar acvf archive.tar.gz filea fileb filec 
filea 

fileb 

filec 

$ tar tf archive.tar.gz 

filea 

fileb 

filec 


9. 从 归档 中 排除 部 分 文件 


通过 指定 模式 可 以 从 归档 中 排除 部 分 文件 。 用 --exclude [PATTERN] 排除 匹配 通配符 样式 LE 
的 文件 。 


例如 ， 排 除 所 有 的 .txt 文件: 


























$ tar -cf arch.tar * --exclude "*.txt" 


RR 
| ea 样式 应 该 使 用 双 引 号 来 引用 ， 避 免 shell 对 其 进行 扩展 。 ] 
也 可 以 将 需要 排除 的 文件 列表 放 入 文件 中 ， 同 时 配合 选项 -x: 
$ cat list 
filea 
fileb 


$ tar -cf arch.tar * -xX list 


188 第 6 章 B 计 划 





这 样 就 无 需 对 flea 和 fileb 进 行 归档 了 。 
10. 排除 版 本 控制 目录 


我 们 通常 使 用 tar 归 档 文件 来 分 发 源 代 码 。 大 多 数 源 代码 都 是 使 用 版 本 控制 系统 进行 维护 
的 ， 如 subversion 、Git、mercurial 、cvs 等 。 版 本 控制 系统 中 的 代码 目录 包含 用 来 管理 版 本 的 特殊 
目录 ， 如 .svn 或 .git。 但 源 代码 本 身 并 不 需要 这 些 日 录 ， 所 以 不 应 该 将 它们 包含 在 源 代码 的 tar 归 
档 文 件 中 。 


为 了 在 归档 时 排除 版 本 控制 相关 的 文件 和 目录 ， 可 以 使 用 tar 的 --exclude-vcs 选 项 。 例 如: 











$ tar --exclude-vcs -czZvVvf source code.tar.gz eye of gnome svn 


11. 打印 总 字 节 数 


有 时 候 我 们 需要 知道 归档 了 多 少 字 节 。 用 -totals 就 可 以 在 归档 完成 之 后 打印 出 总 归档 字 节 数 : 





$ tar -cf arc.tar * --exclude "*.txt" --totals 
Total bytes written: 20480 (20KiB, 12MiB/s) 


6.2.5 ”参考 


6.4 节 会 讲解 gzip 命 令 。 


6.3 用 cpio 归档 


cpio 是 另 一 种 类 似 于 tar 的 归档 格式 。 它 用 来 将 多 个 文件 和 文件 夹 存储 为 单个 文件 ， 同 时 保 
留 所 有 的 文件 属性 ， 如 权限 、 文 件 所 有 权 等 。 不 过 ，cpio 并 不 像 rar 那 么 常用 。 它 多 用 于 RPM 软 
件 包 (Fedora 使 用 这 种 格式 )、Linux 内 核 的 initramfs 文 件 ( 包含 了 内 核 镜像 ) 等 。 这 则 攻略 将 给 
出 几 种 cpio 的 用 法 。 








6.3.1 ”实战 演练 


cpio 通 过 stain 获 取 输 入 文件 名 ,并 将 归档 文件 写 人 staout。 我 们 必须 将 stdaout 重 定向 到 
一 个 文件 来 接收 cpio 的 输出 。 


(1) 创建 测试 文件 : 
$ touch filel file2 file3 


Q) 将 测试 文件 按照 下 面 的 方法 进行 归档 : 





$ echo filel file2 file3 | cpio -ov > archive.cpio 
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(3) 列 出 cpio 归 档 文件 中 的 内 容 : 
$ cpio -it < archive.cpio 
(4) 从 cpio 归 档 文件 中 提取 文件 : 


$ cpio -id < archive.cpio 


6.3.2 工作 原理 
对 于 归档 命令 : 


口 -o 指 定 了 输出 ; 
口 -v 用 来 打印 归档 文件 列表 。 





通过 cpio, 我 们 能 够 利用 文件 的 绝对 路 径 进行 归档 。/usrsomedir 就 是 
一 个 绝对 路 径 ， 因 为 它 是 以 根 目 录 (/ ) 作为 路 径 的 起 始 。 
相对 路 径 不 以 / 开头 ， 而 是 以 当前 目录 作为 起 始点 。 例 如 ，testfile 表 
~ 一 示 有 一 个 目录 test， 而 file 位 于 test 目 录 中 。 
当 进 行 提取 时 ，cpio 会 将 内 容 提 取 到 绝对 路 径 中 。 而 tar 会 移 去 绝 
对 路 径 开 头 的 /， 将 之 转换 为 相对 路 径 。 


在 列 出 给 定 cpio 归 档 文 件 所 有 内 容 的 命令 中 : 





口 -i 用 于 指定 输入 ; 
口 -t 表 示 列 出 归档 文件 中 的 内 容 。 


当 使 用 命令 进行 提取 时 ，-a 用 来 表示 提取 。cpio 在 覆盖 文件 时 不 会 发 出 提示 。 





6.4 使 用 gzip 压缩 数据 

gzip 是 GNU/Linux 平 台 下 常用 的 压缩 格式 。gzip、gunzip、zcat 都 可 以 处 理 这 种 压缩 文件 
类 型 。 但 gzip 只 能 压缩 单个 文件 或 数据 流 ， 而 无 法 对 目录 和 多 个 文件 进行 归档 。 因 此 我 们 需要 先 
创建 tar 归 档 文件 ， 然 后 再 用 gzip 进 行 压缩 。 计 我 们 来 看 看 gzip 的 使 用 方法 。 





6.4.1 实战 演练 
gzip 可 以 用 于 压缩 与 解压 缩 。 
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(1) 要 使 用 gzip 压 缩 文件 ， 可 以 使 用 下 面 的 命令 : 








$ gzip filename 
$ 1s 
filename .gz 


(2) 将 gzip 文 件 解 压缩 的 方法 如 下 : 


$ gunzip filename.gz 
$ 1s 
file 


(3) 列 出 压缩 文件 的 属性 信息 : 











$ gzip -1 test.txt.gz 
compressed uncompressed ratio uncompressed name 
35 6 -33.3% test.txt 


(4) gzip 命 令 可 以 从 stdin 中 读 入 文件 ， 也 可 以 将 压缩 文件 写 出 到 stdout。 
从 stqdin 读 人 并 将 压缩 后 的 数据 写 出 到 stdout: 











$ cat file | gzip -c > file.gz 
选项 -c 用 来 将 输出 指定 到 stdout。 


(3) 我 们 可 以 指定 gzip 的 压缩 级 别 。 用 --fast 或 --best 选 项 分 别提 供 最 低 或 最 高 的 压 
缩 比 。 


6.4.2 补充 内 容 
gzip 命 令 通常 与 其 他 命令 结合 使 用 。 它 还 有 一 些 高 级 选项 可 以 用 来 指定 压缩 比 。 让 我 们 来 


看 看 gzip 的 这 些 特性 








9 


1. 压缩 归档 文件 
我 们 通常 将 gzip 与 归档 文件 结合 使 用 。 有 两 种 方法 可 以 创建 经 由 gzip 压 缩 过 的 归档 文件 。 
口 方法 1 























$ tar -czvvf archive.tar.gz [FILES] 
或 者 
$ tar -cavvf archive.tar.gz [FILES] 


选项 -a 表明 从 文件 扩展 名 自动 推断 压缩 格式 。 
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口 方法 2 
首先 ,创建 一 个 tar 归 档 文件 : 





$ tar -cvvf archive.tar [FILES] 
压缩 tar 归 档 文 件 : 
$ gzip archive.tar 
如 果 有 大 量 文件 (上 百 个 ) 需要 归档 及 压缩 ， 我 们 可 以 采用 方法 2， 并 稍 作 变动 。 将 多 个 文 
件 作为 命令 行 参数 传递 给 Far 的 问题 在 于 : tar 只 能 从 命令 行 中 接受 有 限 个 文件 。 要 解决 这 个 问 
题 ， 我 们 可 以 在 循环 中 使 用 追加 选项 ( -r ) 来 逐个 添加 文件 : 





FILE LIST="filel file2 file3 file4 file5" 


for £ in $FILE LIST; 
do 
tar -rvf archive.tar $f 
done 
gzip archive.tar 
如 果 要 提取 经 由 gzip 压 缩 的 归档 文件 中 的 内 容 ， 可 以 使 用 : 
$ tar -xavvf archive.tar.gz -C extract directory 


在 上 面 的 命令 中 ， 选 项 -a 用 于 自动 检测 压缩 格式 。 


2. zcat 一 一 无 需 解压 缩 ， 直 接 读 取 gzip 格 式 文件 EE 


zcat 命 令 无 需 人 工 干涉 ， 直 接 就 可 以 .gz 文件 中 的 内 容 提取 到 stdaout。 下 面 的 方法 可 以 在 
保持 .gz 文件 不 变 的 情况 下 ， 将 其 中 的 文件 提取 到 stdout 中 








$ 1s 
test .gz 


$ zcat test.gz 
A test file 
# 文件 test 和 包含 了 一 行文 本 "A test file" 


$ 1s 
test .gz 


3. 压缩 率 
我 们 可 以 指定 压缩 率 ， 它 共有 9 级 ， 其 中 : 


192 第 6 章 B 计 划 





口 1 级 的 压缩 率 最 低 ， 但 是 压缩 速度 最 快 ; 
口 9 级 的 压缩 率 最 高 ， 但 是 压缩 速度 最 慢 。 


你 可 以 按照 下 面 的 方法 指定 压缩 比 : 











$ gzip -5 test.img 
这 应 该 能 在 压缩 速度 和 压缩 比 之 间 获 得 一 个 不 错 的 平衡 。 
4. 使 用 bzip2 


bzip2 是 另 一 种 常用 的 工具 ,其 功能 和 语法 同 gzip 非 常 类 似 。 唯 一 的 不 同 在 于 bzip2 的 压缩 
效率 比 gzip 更 高 ， 但 花费 的 时 间 比 gzip 更 长 。 


用 bzip2 进 行 压缩 ; 






































$ bzip2 filename 


解压 缩 bzip2 格 式 的 文件 : 





$ bunzip2 filename .bz2 


生成 tar.bz2 文 件 并 从 中 提取 内 容 的 方法 同 之 前 介绍 的 tar.gz 类 似 : 





$ tar -xjvf archive.tar.bz2 


其 中 -j 表 明 该 归档 文件 是 pzip2 格 式 。 


5. 使 用 lzma 
1zma 是 另 一 种 压缩 工具 ， 它 的 压缩 率 甚 至 比 gzip 和 bzip2 更 好 。 
使 用 1zma 进 行 压缩 : 





$s lzma filename 


解压 缩 1zma 文 件 : 





$ unlzma filename.1zma 
可 以 使 用 ar 命令 的 --1zma 选 项 对 生成 的 tar 归 档 文件 进行 压缩 或 提取 : 
$ tar -cvvf --lzma archive.tar.lzma [FILES] 
或 者 
$ tar -cavvf archive.tar.lzma [FILES] 


如 果 要 将 经 过 1zma 压 缩 过 的 tar 归 档 文件 中 的 内 容 提 取 到 指定 的 目录 中 ， 可 以 使 用 : 
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$ tar -xvvf --lzma archive.tar.lzma -C extract directory 


其 中 ，-x 用 于 提取 内 容 ，--1zma 指 定 使 用 lzma 对 归档 文件 进行 解压 缩 。 
我 们 也 可 以 用 : 


$ tar -xavvf archive.tar.lzma -C extract directory 


6.4.3 ”参考 


6.2 节 讲解 了 tar 命 令 。 


6.5 用 zip 归档 和 压缩 

ZIP 作 为 一 种 流行 的 压缩 格式 ， 在 很 多 平台 中 都 可 以 看 到 它 的 身影 。 在 Linux 下 ， 它 的 应 用 不 
如 gzip 或 bzip2 那 么 广泛 ,但 是 Internet 上 的 文件 通常 都 采用 这 种 格式 。 在 这 这 攻略 中 ， 我 们 会 
看 到 如 何 使 用 zip 进 行 压缩 与 解压 缩 。 





6.5.1 ”实战 演练 
来 看 看 zip 的 各 种 选项 的 用 法 。 


(1) 对 归档 文件 采用 ZIP 格 式 进行 压缩 : 
$ zip archive name.zip [SOURCE FILES/DIRS] 


例如 : 





$ zip file.zip file 
该 命令 会 生成 file.zip。 
(2) 对 目录 和 文件 进行 递归 操作 : 
$ zip -r archive.zip folderl1 folder2 
其 中 ，-r 用 于 指定 递归 操作 。 
(3) 要 从 ZIP 文 件 中 提取 内 容 ， 可 以 使 用 : 
$ unzip file.zip 


在 完成 提取 操作 之 后 ，unzip 并 不 会 删除 file.zip 〈 这 一 点 与 unLlzma 和 gunzip 不 同 )。 
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(1) 如 果 需 要 更 新 压缩 文件 中 的 内 容 ， 使 用 选项 -u: 
$ zip file.zip -u newfile 

(2) 从 压缩 文件 中 删除 内 容 ， 则 使 用 -a: 
$ zip -d arc.zip file.txt 

(3) 列 出 压缩 文件 中 的 内 容 : 


$ unzip -1 archive.zip 





6.5.2 ”工作 原理 


尽管 同 大 多 数 我 们 已 经 讲 过 的 归档 、 压 缩 工具 类 似 , 但 zip 在 完成 归档 之 后 并 不 会 删除 源 文 
件 ， 这 一 点 与 1zma，gzip，bzip2 不 同 。 最 重要 的 是 ， 尽 管 与 tar 相 像 ，zip 既 可 以 进行 归档 ， 
也 可 以 进行 压缩 ， 而 单 任 ar， 则 无 法 进行 压缩 操作 。 














6.6 更 快速 的 归档 工具 pbzip2 


如 今 大 多 数 计算 机 都 配备 了 至 少 两 个 处 理 器 核心 , 这 基本 上 相当 于 拥有 了 两 块 物理 CPU。 但 
是 仅仅 是 一 块 多 核 CPU 并 不 代表 程序 可 以 运行 得 更 快 , 重要 的 是 程序 自身 能 够 利用 多 个 处 理 噩 核 


六 









































我 们 目前 已 经 看 到 的 多 数 压 缩 命令 只 能 利用 单个 处 理 器 核心 ， 所 以 速度 并 不 会 特别 快 。 而 
pbzip2 能 够 借助 多 个 处 理 器 核心 来 降低 压缩 文件 所 需 的 时 间 。 








6.6.1 预备 知识 
多 数 发 布 版 中 通常 都 没有 预 装 pbzip2， 你 得 使 用 软件 包 管理 器 自行 安装 。 


6.6.2 ”实战 演练 
来 看 看 如 何 使 用 pbzip2 来 压缩 及 提取 文件 。 
(1) 压缩 单个 文件 : 
pbzip2 myfile.tar 
pbzip2 会 自动 检测 系统 中 处 理 需 核心 的 数量 , 然后 将 myfile.tar 压 缩 成 myfile.tar.bz2。 
(2) 要 将 多 个 文件 或 目录 进行 归档 及 压缩 ， 可 以 使 用 rar 配合 ppzip2 来 实现 ; 


tar cf myfile.tar.bz2 --use-compress-prog=pbzip2 dir to compress/ 
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或 者 

tar -c directory to compress/ | pbzip2 -c > myfile.tar.bz2 
(3) 从 pbzip2 格 式 的 文件 中 进行 提取 。 

如 果 是 tar.bz2 文 件 ， 我 们 可 以 一 次 性 完成 解压 缩 和 提取 工作 : 

















pbzip2 -dc myfile.tar.bz2 | tar x 


如 果 是 经 过 pbzip2 压 缩 过 的 归档 文件 ， 可 以 使 用 : 











pbzip2 -Q myfile.tar.bz2 


6.6.3 工作 原理 

pbzip2 在 内 部 使 用 的 压缩 算法 和 bzip2 一 样 ， 但 是 它 利 用 pthreaqs (一 个 线程 库 ) 来 同时 
对 多 个 数据 块 进行 压缩 。 不 过 这 一 切 对 于 用 户 而 言 都 是 透明 的 ， 结 果 就 是 更 快 的 压缩 速度 。 

同 gzip 或 bzip2 一 样 ，pbzip2 并 不 能 创建 归档 文件 ， 它 只 能 对 单个 文件 进行 操作 。 如 果 要 
压缩 多 个 文件 或 目录 ， 还 得 结合 rar 来 使 用 。 











6.6.4 补充 内 容 
pbzip2 还 有 另外 一 些 有 用 的 选项 。 
1. 手动 指定 处 理 器 数量 


使 用 pbzip2 的 -p 选 项 来 手动 指定 处 理 器 核心 的 数量 。 如 果 无 法 自动 检测 处 理 器 核心 数量 或 ee 
是 希望 能 够 释放 一 些 处 理 核心 来 进行 其 他 工作 ，-p 选 项 就 能 派 上 用 场 了 。 




















pbzip2 -p4 myfile.tar 
上 面 的 命令 告诉 ppbzip2 使 用 4 个 处 理 器 核心 。 

2. 指定 压缩 比 

像 其 他 压缩 工具 一 样 ， 我 们 可 以 使 用 从 1 到 9 的 选项 来 分 别 指定 最 快 和 最 优 的 压缩 比 。 








6.7 创建 压缩 文件 系统 


squashfs 是 一 种 具有 超 高 压缩 率 的 只 读 型 文件 系统 ， 这 种 文件 系统 能 够 将 2GB~3GB 的 数据 
压缩 成 一 个 700MB 的 文件 。Linux LiveCD ( 或 是 LiveUSB ) 就 是 使 用 squashfs 创 建 的 。 这 类 CD 
利用 只 读 型 的 压缩 文件 系统 将 根 文件 系统 保存 在 一 个 压缩 文件 中 。 可 以 使 用 环 回 方式 将 其 挂 载 并 
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装 人 完整 的 Linux 环 境 。 如 果 进 程 需要 某 些 文件 ， 可 以 将 它们 解压 ， 然 后 载 和 人 内存 中 使 用 。 


如 果 即 需要 采用 超 高 的 文件 压缩 率 ， 又 希望 在 无 需 解 压 的 情况 下 读 取 少 量 文件 ， 那 么 
squashfs 就 能 够 大 显 身 手 了 。 解 压 体 积 较 大 的 压缩 文件 可 得 花 上 一 阵 工夫 。 但 如 果 将 文件 以 环 
回 形 式 挂 载 , 那 速度 会 变 得 飞快 。 因 为 只 有 出 现 访问 请 求 时 ， 对 应 的 那 部 分 压缩 文件 才 会 被 解压 
缩 。 让 我 们 来 看 看 如 何 使 用 squashfs。 

















6.7.1 预备 知识 


squashfs 在 内 部 采用 了 gzip 和 1zma 这 类 压缩 算法 。 所 有 的 现代 Linux 发 行 版 都 对 其 提供 了 
支持 。 但 要 想 创 建 sauashfs 文 件 ， 则 需要 额外 安装 squshfs-tools。 


6.7.2 ”实战 演练 
来 看 看 如 何 创建 并 挂 载 sauashfs 文 件 。 
(1) 添加 源 目 录 和 文件 ， 创 建 一 个 sauashfs 文 件 : 











$ mksquashfs SOURCES compressedfs.squashfs 
SOURCES 部 分 可 以 是 通配符 或 文件 、 目 录 路 径 。 
例如 : 





$ sudo mksquashfs /etc test.squashfs 

Parallel mksquashfs: Using 2 processors 

Creating 4.0 filesystem on test.squashfs, block size 131072. 
[=======================================] 1867/1867 100% 


KW 还 有 更 多 的 细节 信息 会 出 现在 终端 上 。 由 于 版 面 的 限制 ， 这 
> 里 就 不 再 列 出 这 些 信 息 了 。 


(2) 利用 环 回 形 式 挂 载 squashfs 文 件 : 


# mkdir /mnt/squash 
# mount -o loop compressedfs.squashfs /mnt/squash 


你 可 以 访问 /mnt/squashfs 访 问 其 中 的 内 容 。 


6.7.3 补充 内 容 
可 以 指定 额外 的 参数 来 定制 sauashfs 文 件 系 统 。 让 我 们 来 看 看 这 些 命令 选项 。 
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在 创建 squashfs 文 件 时 排除 部 分 文件 
创建 squashfs 文 件 时 , 我 们 可 以 排除 部 分 文件 , 这 些 文件 可 以 用 文件 列表 或 通配符 来 指定 。 
使 用 选项 -e， 将 需要 排除 的 文件 列表 以 命令 行 参数 的 方式 来 指定 。 例 如 : 




















$ sudo mksquashfs /etc test.squashfs -e /etc/passwd /etc/shadow 
其 中 ， 选 项 -e 用 于 将 文件 passwd 和 shadow 排 除 在 外 。 

也 可 以 将 需要 排除 的 文件 名 列表 写 人 文件 ， 然 后 用 -ef 指定 该 文件 : 

$ cat excludelist 

/etc/passwd 


/etc/shadow 


$ sudo mksquashfs /etc test.squashfs -ef excludelist 


如 果 和 希望 在 排除 文件 列表 中 使 用 通配符 ,那么 可 以 使 用 -wildcardq 选 项 。 














6.8 ”使 用 rsync 备份 系统 快照 

备份 数据 算得 上 是 多 数 系统 管理 员 日 常 必 备 的 工作 。 除 了 备份 本 地 文件 , 我 们 可 能 还 得 对 Web 
服务 器 或 远 端 数据 进行 备份 。z*sync 可 以 对 位 于 不 同位 置 的 文件 和 目录 进行 同步 ， 它 利用 差异 计 
算 以 及 压缩 技术 来 最 小 化 数据 传输 量 。 相 对 于 cp 命令 , rsync 的 优势 在 于 使 用 了 高 效 的 差异 算法 。 
另外 ， 它 还 支持 网 络 数据 传输 。 在 进行 复制 的 同时 ，zsync 会 比较 源 端 和 目的 端的 文件 ， 只 有 当 
文件 有 更 新 时 才 进 行 复制 。rsync 也 支持 压缩 、 加 密 等 多 种 特性 。 让 我 们 看 看 rsync 的 使 用 方法 。 


6.8.1 实战 演练 


下 面 来 看 看 如 何 使 用 rsync 进 行文 件 复制 及 备份 。 
(1) 将 源 目录 复制 到 目的 端 : 
$ rsync -av source path destination path 


例如 : 
































$ rsync -av /home/slynux/data slynux@192.168.0.6:/home/backups/data 

其 中 : 

口 -a 表 示 要 进行 归档 ; 

口 -v 表 示 在 stdout 上 打印 出 细节 信息 或 进度 。 

上 面 的 命令 会 以 递归 的 方式 将 所 有 的 文件 从 源 路 径 复制 到 目的 路 径 。 我 们 可 以 指定 
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本 地 路 径 ， 也 可 以 指定 远 端 路 径 。 
(2) 将 数据 备份 到 远程 服务 需 或 主机 : 


$ rsync -av source dir username@host :PATH 


如 果 需 要 在 目的 端 建立 一 份 镜像 ， 只 需要 定期 运行 同样 的 rsync 命 令 即 可 。 它 只 会 
对 更 改过 的 文件 进行 复制 。 


(3) 用 下 面 的 方法 将 远程 主机 上 的 数据 恢复 到 本 地 主机 : 


$ rsync -av username@host:PATH destination 























rsync 命 令 用 SSH 连 接 远程 主机 , 因此 必须 使 用 user@host 这 种 形 
式 设 定 远程 主机 的 地 址 ， 其 中 user 代 表 用 户 名 ，host 代 表 远 程 主机 的 
JP 地 址 或 主机 名 。 而 PATH 指 定 需要 从 中 复制 数据 的 远程 主机 上 的 
~ 路 径 。 
确保 远程 主机 上 安装 并 运行 着 OpenSSH 服 务 器 。 如 果 连 接 远程 主 
机 时 不 希望 输入 密码 ， 可 以 参考 7.8 节 。 


(4) 通过 网 络 进 行 传输 时 ,压缩 数据 能 够 明显 改善 传输 效率 ,我 们 可 以 用 rsync 的 选项 -z 
指定 在 网 络 传输 时 压缩 数据 。 例 如 : 


$ rsync -avz source destination 
(5) 将 一 个 目录 中 的 内 容 同 步 到 另 一 个 目录 : 
$ rsync -av /home/test/ /home/backups 


这 条 命令 将 源 目 录 ( /home/test ) 中 的 内 容 (不 包括 目录 本 身 ) 复制 到 现 有 的 backups 
日 录 中 oo 


(6) 将 包括 目录 本 身 在 内 的 内 容 复制 到 另 一 个 目录 中 : 
$ rsync -av /home/test /home/backups 


这 条 命令 将 包括 源 目录 本 身 ( /home/test ) 在 内 的 内 容 复 制 到 新 创建 的 目录 backups 中 。 














就 路 径 格 式 而 言 ， 如 果 我 们 在 源 路 径 末 尾 使 用 /， 那 么 rsync 会 
人 将 sourch_path 尾 端 目 录 中 的 所 有 内 容 复制 到 目的 端 。 
~ 如 果 没 有 使 用 /，rsync 会 将 sourch_path 尾 端 目 录 林 身 复制 到 
目的 端 。 
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以 下 命令 复制 test 目 录 到 目的 端 目录 中 : 


$ rsync -av /home/test /home/backups/ 
$ rsync -av /home/test /home/backups 


如 果 在 daestination_ path 末尾 使 用 /， 那 么 rsync 会 将 来 自 源 
端的 内 容 复 制 到 目的 端 目 录 中 。 
~ 如 果 没 有 使 用 /, rsync 会 在 目的 端 路 径 尾 部 创建 一 个 同名 目录 ， 
然后 将 源 端 内 容 复 制 到 这 个 目录 中 。 


6.8.2 工作 原理 


rsync 所 使 用 的 源 路 径 和 目的 路 径 既 可 以 是 本 地 路 径 , 也 可 以 是 远程 路 径 。 最 重要 的 是 ， 两 者 丝 
可 以 是 远程 路 径 。 通 常 使 用 ssH 进 行 远程 连接 ， 由 rsync 来 决定 应 该 复制 哪些 文件 。 本 地 路 径 和 远程 


路 径 看 起 来 像 这 样 : 





























口 /home/slynux/data (本 地 路 径 ) 
口 slynux@192.168.0.6:/home/backups/data ( 远程 路 径 ) 


/home/slynux/data 指 定 的 是 执行 sync 命 令 的 那 台 主机 上 的 绝对 路 径 。slynux@192.168.0.6:/home/ 
backups/data 指 定 的 是 他 地 址 为 192.168.0.6 的 主机 ， 以 用 户 siynux 的 身份 登录 ， 路 径 为 
/home/backups/data。 


6.8.3 补充 内 容 


可 以 通过 命令 行 选项 来 指定 rsync 命 令 的 其 他 功能 。 让 我 们 来 逐 项 查看 。 























1. 在 使 用 rsync 进 行 归档 的 过 程 中 排除 部 分 文件 


对 远 端 内 容 进 行 归档 时 ， 有 些 文件 并 不 需要 进行 更 新 。 我 们 可 以 告知 rsync 将 某 些 文件 从 本 
次 操作 中 排除 。 有 两 个 选项 可 以 用 来 排除 文件 : 





--exclude PATTERN 


可 以 通 





过 通配符 指定 需要 排除 的 文件 。 例 如 


$ rsync -avz /home/code/some code /mnt/disk/backup/code --exclude "*.txt" 
该 命令 不 对 .txt 文 件 进 行 备份 。 
或 者 我 们 可 以 通过 一 个 列表 文件 指定 需要 排除 的 文件 。 


这 可 以 利用 --exclude-from FILEPATH。 
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2. 在 更 新 rsync 备 份 时 ， 删 除 不 存在 的 文件 


默认 情况 下 ，rsync 并 不 会 在 目的 端 删 除 那 些 在 源 端 已 不 存在 的 文件 。 如 果 要 删除 这 些 已 不 
存在 文件 ， 使 用 rsync 的 --aelete 选 项 











$ rsync -avz SOURCE DESTINATION --delete 

3. 定期 进行 备份 

你 可 以 创建 一 个 cron 任 务 来 定期 进行 备份 。 

下 面 是 一 个 简单 的 例子 : 

$ crontab -ev 

添加 上 这 么 一 行 : 

0 */10 * * * rsync -avz /home/code user@IP ADDRESS:/home/backups 


上 面 的 crontab 条 目 将 rsync 调 度 为 每 10 个 小 时 运行 一 次 。 





*/10 处 于 crontab 语 法 中 的 钟点 位 ( hour position )，/10 表 明 每 10 小 时 执行 一 次 备份 。 如 果 
*/10 出 现在 分 钟 位 ( minutes postion )， 那 就 是 每 10 分 钟 执行 一 次 备份 。 





请 参阅 9.7 节 了 解 如 何 配置 crontab。 


6.9 用 Git 进 行 基于 版 本 控制 的 备份 


人 们 在 备份 数据 时 会 采取 不 同 的 策略 。 不 过 比 起 将 整个 源 目录 复制 到 备份 目录 中 , 并 使 用 日 
期 或 时 间作 为 版 本 号 , 利用 差异 备份 要 更 有 效 ， 因 为 前 者 只 会 白白 浪费 存储 空间 。 我 们 只 需要 复 
制 那些 在 备份 之 后 发 生变 化 的 那些 文件 ， 这 叫做 增 量 备份 。 可 以 用 rsync 这 类 工具 来 手动 创建 增 
量 备份 , 不 过 恢复 这 种 备份 可 不 是 件 易 事 。 维 护 和 恢复 变更 的 最 好 方法 是 使 用 版 本 控制 系统 。 由 
于 代码 的 变更 相当 频繁 ， 版 本 控制 系统 多 用 于 软件 开发 与 代码 维护 中 。Git 是 目前 最 具 声 望 、 最 
高 效 的 版 本 控制 系统 。 我 们 可 以 在 非 编程 环境 下 用 Git 进 行 常规 文件 的 备份 。 






























































6.9.1 预备 知识 


我 们 有 一 个 包含 了 多 个 文件 和 子 目录 的 目录 。 现 在 需要 跟踪 目录 内 容 的 变更 并 对 其 进行 备 
份 。 如果 数 据 受 损 或 丢失 ， 必须 能 够 恢复 数据 之 前 的 备份 。 我 们 需要 将 数据 备份 到 本 地 主机 或 远 
程 主 机 中 。 使 用 软件 包 管 理 器 安装 Git， 然 后 来 学 习 它 的 用 法 。 
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6.9.2 ”实战 演练 
先 来 看 看 如 何 使 用 Git 进 行 数据 备份 。 
(1) 进入 需要 备份 的 目录 : 





$ cd /home/data/source 
将 其 作为 需要 被 跟踪 的 目录 源 。 
(2) 设置 并 初始 化 远 端 备份 目录 。 在 远程 主机 中 创建 备份 目录 : 














$ mkdir -p /home/backups/backup.git 
$ cd /home/backups/backup.git 
$ git init --bare 


在 源 主机 中 执行 下 列 步 又 。 
(1) 在 源 主机 中 将 用 户 详细 信息 添加 到 Git: 








$ git config --global user.name "Sarath Lakshman" 
$ git config --global user.email slynux@slynux.com 


(2) 初始 化 主机 中 需要 进行 备份 的 源 目 录 。 在 源 目录 中 执行 下 列 命令 : 


$ git init 
Initialized empty Git repository in /home/backups/backup.git/ 


$ git commit --allow-empty -am "Init" 
[master (root-commit) b595488] Init 


(3) 在 源 目录 中 执行 下 列 命 令 来 添加 远程 Git 目 录 并 同步 备份 : 








$ git remote add origin user@remotehost:/home/backups/backup.git 


$ git push origin master 
Counting objects: 2, done. 
Writing objects: 100% (2/2), 153 bytes, done. 
Total 2 (delta 0), reused 0 (delta 0) 
To user@remotehost:/home/backups/backup.git 
* [new branch] master -> master 


(4) 为 Git 跟 踪 添 加 或 删除 文件 。 
下 面 的 命令 将 当前 目录 下 的 所 有 文件 和 文件 夹 添加 到 备份 列表 中 
$ git add * 


我 们 可 以 有 条 件 地 添加 某 些 文件 到 备份 列表 中 : 
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$ git add *.txt 
$ git add *.py 


删除 不 需要 跟踪 的 文件 和 文件 夹 : 
$ git rm file 
也 可 以 使 用 通配符 : 
$ git rm *.txt 
(5) 检查 点 或 标注 备份 点 
用 下 列 命 令 来 标注 一 个 附带 消息 的 备份 的 检查 点 : 





$ git commit -m "Commit Message" 

我 们 需要 定期 更 新 远 端的 备份 ， 因此 得 设置 一 个 cron 任 务 ( 例如 , 每 5 个 小 时 进行 一 
次 备份 ): 

创建 一 个 crontab 条 目 : 

0 */5 * * * /home/data/backup.sh 

创建 脚本 /home/data/backup.sh: 


#!/bin/ bash 

cd /home/data/source 

git add . 

git commit -am "Backup taken at @ $(date)" 
git push 


现在 我 们 就 算是 完成 了 备份 系统 的 设置 。 
(6) 查看 所 有 版 本 的 备份 : 











$ git log 


(7) 要 恢复 到 之 前 的 某 个 状态 或 版 本 ， 需 要 查看 一 个 由 32 位 十 六 进 制 串 组 成 的 提交 ID 
通过 git checkout 来 使 用 提交 ID。 





























如 果 提 交 有 DD 为 3131f966lec1739f72c213ec$769bc0abefa8$a9 ， 那 就 是 : 
$ git checkout 3131f9661lec1739f72c213ec5769bc0abefa85a9 
以 下 命令 可 以 使 转化 持久 化 : 


$ git commit -am "Restore @ $(date) commit ID: 3131f9661ec1739f72c213ec5769 
bc0abefa85a9" 
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再 次 查看 有 关 版 本 的 细节 信息 : 





$ git log 


(8) 如 果 工 作 目 录 由 于 某 些 原因 受到 了 损坏 ， 我 们 需要 用 远 端 的 备份 来 进行 修复 。 按 照 
下 面 的 方法 从 远 端 备份 中 重建 损坏 的 内 容 : 








$ git clone user@remotehost:/home/backups/backup.git 


这 条 命令 将 创建 一 个 包含 之 前 全 部 内 容 的 目录 。 


尽管 就 保留 版 本 化 的 文本 文件 ( 包括 文档 、 源 代码 等 等 ) 副本 而 
言 ，Git 表 现 的 算是 相当 不 错 了 。 0 
QN 数据 备份 。 例 如 用 Git 来 对 图 片 库 进 行 备份 /版 本 管理 ， 就 没什么 
了 。 这 是 因为 如 果 涉 及 的 是 二 进 制 文件 ，Git 保 留 的 是 整 Sai 而 
非 文 件 之 间 的 差异 ， 这 样 会 占用 大 量 的 磁盘 室 间 。 


6.10 用 fsarchiver 创建 全 盘 镜 像 
fsarchivez 可 以 将 整个 文件 系统 中 的 内 容 保存 成 一 个 压缩 形式 的 归档 文件 .鉴于 这 种 能 
它 成 为 功能 最 为 完备 ， 也 最 为 易 用 的 备份 工具 之 一 。 


0 (一 款 知 名 的 文件 系统 备份 工具 ) 的 接班 人 ， 能 够 支持 像 
ext4 这 种 较 新 的 文件 系统 ， 不 过 partimage 配 备 了 一 套 小 型 的 图 形 用 户 界面 ， 相 比 之 下 更 易 
用 一 些 。 











6.10.1 预备 知识 
fsazchivez 默 认 并 没有 安装 在 大 多 数 发 布 版 中 。 你 得 用 软件 包 管 理 器 自行 安装 。 更 多 的 信 
息 可 以 参考 http:/www.fsarchiver.org/Installation 。 
6.10.2 ”实战 演练 
(1) 创建 文件 系统 /分 区 备份 。 
使 用 fsarchiver 的 savefs 选 项 : 


fsarchiver savefs backup .fsa /dev/sdal 


backup.fsa 是 最 终 的 备份 文件 ，/dev/sda/ 是 要 备份 的 分 区 。 
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(2) 同时 备份 多 个 分 区 。 


还 是 使 用 savefs 选 项 ， 将 分 区 作为 fsarchiver 最 后 的 参数 : 





fsarchiver savefs backup.fsa /dev/sdal /dev/sda2 
(3) 从 备份 归档 中 恢复 分 区 。 
使 用 fsarchiver 的 restfs 选 项 : 


fsarchiver restfs backup.fsa id=0,dest=/dev/sdal 


id=0 表 明 我 们 希望 从 备份 归档 中 提取 第 一 个 分 区 的 内 容 ， 将 其 恢复 到 由 
dest=/dev/sdal 所 指定 的 分 区 中 。 


(4) 从 备份 归档 中 恢复 多 个 分 区 。 
像 之 前 一 样 ， 使 用 *estfs 选 项 : 
fsarchiver restfs backup.fsa id=0,dest=/dev/sdal id=1,dest=/dev/sdbl 


我 们 使 用 了 两 组 iq，dest 人 告诉 fsarchiver 从 备份 中 将 前 两 个 分 区 的 内 容 恢复 到 指 
定 的 物理 分 区 中 。 











6.10.3 工作 原理 


和 tar 的 工作 原理 非常 类 似 ，fsarchiver 裔 历 整 个 文件 系统 来 生成 一 个 文件 列表 ， 然 后 将 
所 有 的 文件 保存 在 压缩 过 的 归档 文件 中 。 不 像 tar 那 样 只 保存 文件 信息 ，fsarchiver 还 要 对 文 
件 系统 进行 备份 。 这 意味 着 它 可 以 很 容易 地 将 备份 恢复 到 一 个 全 新 的 系统 中 , 因为 不 必 再 重建 文 
件 系 统 了 。 


如 果 你 是 第 一 次 看 到 /devwsdal 这 样 的 分 区 记 法 , 那 有 必要 解释 一 下 。 在 Linux 中 ，/dev 下 存放 
的 都 是 称 为 设备 文件 的 一 类 特殊 文件 , 它们 分 别 指向 某 个 物理 设备 。sdal 中 的 sd 指 的 是 SATA disk， 
接 下 来 的 字母 可 以 是 a，b，c 等 ， 最 后 跟 上 分 区 编号 ， 如 图 6-1 所 示 。 
































2 =“ 
设备 文件 系统 | | SATA 磁盘 磁盘 编号 分 区 编号 


















































图 6-1 显示 了 Linux 中 磁盘 设备 的 文件 名 的 各 个 组 成 部 分 
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本 章 内 容 

口 网 络 设置 口 使 用 SSH 进 行 端口 转发 

口 使 用 ping 口 在 本 地 挂 载 点 上 挂 载 远 程 驱动 器 
口 列 出 网 络 上 所 有 的 活动 主机 口 网 络 流量 与 端口 分 析 

口 用 SSH 在 远程 主机 上 运行 命令 口 创建 套 接 字 

口 通过 网 络 传输 文件 口 互联 网 连接 共享 

口 连接 无 线 网 络 口 使 用 iptables 架 设 简易 防火 墙 
口 用 SSH 实 现 无 密码 自动 登录 





7.1 简介 








联网 就 是 将 主机 进行 互联 以 形成 网 络 , 使 得 网 络 中 的 主机 得 以 交换 信息 。 应 用 最 广泛 的 网 站 
栈 就 是 TCP/P， 其 中 每 个 节点 都 分 配 了 一 个 用 作 标识 的 独 一 的 耳 地 址 。 有 很 多 联网 参数 ， 如 子 网 
掩 码 、 路 由 、 端 口 和 DNS 等 ， 我 们 需要 对 这 些 知识 有 一 个 基本 的 认识 。 


一 些 利 用 网 络 的 应 用 通过 打开 并 连接 到 端口 来 进行 运作 , 端口 用 于 指 代 某 种 服务 , 如 数据 传 

















输 、 远 程 shell 登 录 等 。 有 些 管理 任务 可 以 通过 网 络 进行 。shell 脚 本 也 能 用 来 配置 网 络 节点 、 测 斌 


主机 是 否 可 用 、 自 动 执 行 远程 主机 命令 等 。 本章 着 重 介绍 网 络 相关 的 工具 和 命令 ,以 及 如 何 用 它 
们 解决 各 种 问题 。 


7.2 ”网络 设置 
在 深入 学 习 与 联网 相关 的 攻略 之 前 ， 有 必要 简单 了 解 一 下 网 络 设置 、 相 关 术 语 以 及 用 于 


分 配 IP 地 址 、 添 加 路 由 等 命令 。 这 则 攻略 会 从 头 开始 介绍 GNU/Linux 中 用 于 联网 的 各 种 命令 及 
用 法 。 
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7.2.1 预备 知识 


网 络 接口 用 于 将 主机 连接 到 网 络 。 在 Linux 中 通常 使 用 eth0 、ethl ( 指 代 以 太 网 接口 ) 这 种 方 
式 来 命名 网 络 接口 。 还 有 一 些 其 他 的 接口 , 如 usb0、wlan0 等 , 分 别 对 应 USB 网 络 接口 、 无 线 LAN。 


在 这 则 攻略 中 会 涉及 如 下 命令 : ifconfig、route、nslookup 和 host。 


ifconfig 命 令 用 于 配置 及 显示 网 络 接 口子 网 掩 码 等 详细 信息 。 它 通常 位 于 /sbin/ifconfig 中 。 























7.2.2 ”实战 演练 
(1) 列 出 当前 的 网 络 接 口 配 置 : 


$ ifconfig 
lo Link encap:Local Loopback 
inet addr:127.0.0.1 Mask:255.0.0.0 
inet6addr: ::1/128 Scope:Host 
UP LOOPBACK RUNNING MTU:16436 Metric:1 
RX packets:6078 errors:0 dropped:0 overruns:0 frame:0 
TX packets:6078 errors:0 dropped:0 overruns:0 carrier:0 
collisions:0 txqueuelen:0 
RX bytes:634520 (634.5 KB) TX bytes:634520 (634.5 KB) 
wlan0 Link encap:EthernetHWaddr 00:1lc:bf:87:25:d2 
inet addr:192.168.0.82 Bcast:192.168.3.255 Mask:255.255.252.0 
inet6addr: fe80::21c:bfff:fe87:25d2/64 Scope:Link 
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 
RX packets:420917 errors:0 dropped:0 overruns:0 frame:0 
TX packets:86820 errors:0 dropped:0 overruns:0 carrier:0 
collisions:0 txqueuelen:1000 
RX bytes:98027420 (98.0 MB) TX bytes:22602672 (22.6 MB) 


ifconfig 输 出 的 最 左边 一 列 是 网 络 接口 名 , 右边 的 若干 列 显 示 对 应 的 网 络 接口 的 详 
细 信 息 。 


(2) 手动 设置 网 络 接 口 的 人 P 地 址 : 
# ifconfig wlan0 192.168.0.80 
你 需要 使 用 root 账 号 运行 上 述 命 令 。192.168.0.80 是 要 设置 的 IP 地 址 。 


使 用 以 下 命令 设置 比 IP 地 址 的 子 网 掩 码 : 

















# ifconfig wlan0 192.168.0.80 netmask 255.255.252.0 


(3) 自动 配置 网 络 接 口 。 如 有 果 你 连接 到 一 个 支持 自动 分 配 P 的 有 线 网 络 中 ， 只 需要 使 用 
下 面 的 命令 就 可 以 配置 网 络 接 口 了 : 


# dhclient eth0 
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7.2.3 ”补充 内 容 
让 我 们 再 看 一 些 其 他 的 基础 命令 以 及 用 法 。 
1. 打印 网 络 接口 列表 
这 个 单行 命令 可 以 打印 系统 可 用 的 网 络 接口 列表 。 
$ ifconfig | cut -c-10 | tr -d'' | tr-s '\n' 


lo 
wlan0 


ifconfig 输 出 的 前 10 个 字符 是 用 于 保留 打印 网 络 接口 的 名 称 ， 因 此 我 们 用 cut 命 令 提 取 每 一 行 
的 前 10 个 字符 。tr -a ' “删除 每 一 行 的 所 有 空格 。 用 tr -s '\n' 压 缩 重复 的 换行 符 生 成 接口 
名 称 列表 。 


2. 显 示 IP 地 址 





ifconfig 会 显示 系统 中 所 有 可 用 网 络 接口 的 详细 信息 。 我 们 可 以 限制 它 只 显示 某 个 特定 的 
接口 信息 : 


$ ifconfig iface name 
例如 : 


$ ifconfig wlan0 

wlan0 Link encap:EthernetHWaddr 00:1c:bf:87:25:d2 

inet addr:192.168.0.82 Bcast:192.168.3.255 
Mask:255.255.252.0 


在 上 面 命令 输出 中 ,我们 感 兴趣 的 是 PP 地 址 、 广 播 地 址 、 硬 件 地 址 和 子 网 掩 码 。 它 们 分 别 为 : 








口 HWaddr 00:1c:bf:87:25:d2 是 硬件 地 址 (MAC 地 址 ); 
口 inet addr:192.168.0.82 是 IP 地 址 ; 


口 Bcast:192.168.3.255 是 广播 地 址 ; 


口 Mask:255.255.252.0 是 子 网 掩 码 。 












































在 编写 某 些 脚本 时 , 我 们 可 能 需要 在 脚本 中 提取 某 些 地 址 来 做 进一步 的 处 理 。 常 见 的 是 提取 
卫 地 址 。 要 从 ifconfig 输 出 中 提取 了 地 址 ， 可 以 使 用 : 














$ ifconfig wlan0 | egrep -oO "inet addr:[^ ]*" | grep -oO "[0-9.]*" 

192.168.0.82 
第 一 条 命令 egrep -o "inet addr:[^]*" 会 打印 出 inet addr:192.168.0.82。 模式 以 inet 
adgdr :作为 起 始 ， 以 非 空格 字符 序列 (由 [^]* 指定 ) 作为 结束 。 在 接 下 来 的 管道 操作 中 ， 打 
印 出 数字 与 点 号 (. ) 的 组 合 。 


208 第 7 章 无 网 不 利 





3. 硬件 地 址 (MAC 地 址 ) 欺骗 

在 某 些 情况 下 , 需要 利用 硬件 地 址 对 网 络 上 的 计算 机 进行 认证 或 过 滤 ， 对 此 我 们 可 以 使 用 硬 
件 地 址 欺骗 。 硬 件 地 址 在 ifconfig 输 出 中 是 以 HWaddr 00:1c:bf:87:25:d2 的 形式 出 现 的 。 

我 们 能 够 按照 下 面 的 方法 在 软件 层面 上 进行 硬件 地 址 欺骗 : 

# ifconfig eth0 hw ether 00:1c:bf:87:25:d5 


在 上 面 的 命令 中 ，00:1c:bf:87:25:d5 是 分 配 的 新 MAC 地 址 。 如 果 我 们 需要 通过 部 署 了 MAC 
认证 的 Internet 服 务 提供 商 才 能 够 访问 Internet， 这 招 就 能 排 上 用 场 了 。 注 意 ， 这 在 机 器 重启 之 后 
就 失效 了 。 

4. 名 字 服 务 器 与 DNS (域名 服务 》 


互联 网 最 根本 的 寻 址 方案 是 IP 地 址 (采用 点 分 十 进 制 形式 ,例如 202.11.32.75 )。 然 而 Internet 
上 的 资源 ( 比如 网 站 ) 是 通过 被 称 为 URL 或 域名 的 ASCII 字 符 组 合 来 访问 的 ， 例 如 google.com 就 
是 一 个 域名 , 它 对 应 一 个 (或 多 个 ) 下 地 址 。 在 浏览 需 中 输入 下 地 址 同样 可 以 访问 www.google.com。 

这 种 利用 符号 名 对 下 地 址 进行 抽象 的 技术 就 被 称 为 域名 服务 ( DNS )。 当 我 们 输入 google.com， 
计算 机 使 用 配置 好 的 DNS 服务 器 将 域名 解析 为 对 应 的 耳 地址。 在 本 地 网 络 中 , 我们 可 以 设置 本 地 
DNS ， 以 便 使 用 主机 名 来 命名 本 地 网 络 上 的 主机 。 


分 配给 当前 系统 的 名 字 服 务 需 可 以 通过 读 取 /etc/resolv.conf 查 看 。 例 如 : 


$ cat /etc/resolv.conf 


















































nameserver 8.8.8.8 


我 们 可 以 像 下 面 这 样 手动 添加 名 字 服 务 需 : 





# echo nameserver IP_ ADDRESS >> /etc/resolv.conf 


该 如 何 获 得 域名 所 对 应 的 中 地 址 呢 ? 获 取 IP 地 址 最 简单 的 方法 就 是 ping 给 定 的 域名 ,然后 查 
看 回应 信息 。 例 如 : 





$ ping google.com 
PING google.com (64.233.181.106) 56(84) bytes of data. 
#64 .233 .181.106 是 google .com 对 应 的 IP 地 址 。 


一 个 域名 可 以 分 配 多 个 IP 地 址 。 对 于 这 种 情况 , ping 只 会 显示 其 中 的 一 个 地 址 。 要 想 获 取 分 
配给 域名 的 所 有 IP 地 址 ， 就 得 使 用 DNS 查 找 工 具 了 。 


5. DNS 查 找 


有 多 种 基于 命令 行 的 DNS 查找 工具 ， 这 些 工 具 会 向 DNS 服务 器 请 求解 析 卫 地 址 。host 和 
nslookup 就 是 此 类 DNS 查找 工具 中 的 两 个 。 
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当 执 行 host 时 ， 它 会 列 出 某 个 域名 所 有 的 卫 地 址 。nslookup 类 似 于 host 命 令 , 它 用 于 查询 
DNS 相关 的 细节 信息 以 及 名 字 解 析 。 例 如; 


$ host google .com 

google .com has address 64.233.181.105 
google .com has address 64.233.181.99 
google .com has address 64.233.181.147 
google .com has address 64.233.181.106 
google .com has address 64.233.181.103 
google .com has address 64.233.181.104 


host 也 可 以 列 出 DNS 资源 记录 (DNS resource record): 


$ nslookup google .com 
Server: 8.8.8.8 
Address: 8.8.8.8#53 


Non-authoritative answer: 
Name: google.com 
Address: 64.233.181.105 
Name: google.com 
Address: 64.233.181.99 
Name: google.com 
Address: 64.233.181.147 
Name: google.com 
Address: 64.233.181.106 
Name: google.com 
Address: 64.233.181.103 
Name: google.com 
Address: 64.233.181.104 


Server: 8.8.8.8 
上 面 最 后 一 行 对 应 着 用 于 DNS 解析 的 默认 名 字 服 务 器 。 


如 果 不 使 用 DNS 服 务 器 ， 也 可 以 为 IP 地 址 解析 添加 符号 名 ， 这 只 需要 向 文件 /etc/hosts 中 加 入 
条 目 即 可 。 


用 下 面 的 方法 进行 添加 : 

















# echo IP ADDRESS symbolic name >> /etc/hosts 


例如 : 


# echo 192.168.0.9 backupserver >> /etc/hosts 


添加 了 条 目 之 后 ， 任 何 时 候 解 析 backupserver， 都 会 返回 192.168.0.9。 
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6. 显示 路 由 表 信 息 


多 个 网 络 相互 连接 是 很 常见 的 场景 。 例 如 在 大 学 里 ,不 同 的 职能 部 门 可 能 处 于 一 个 网 络 
中 。 在 这 种 情况 下 ， 一 个 网 络 中 的 设备 如 果 想 同 另 一 个 网 络 中 的 设备 进行 通信 ， 就 需要 借助 
某 个 同时 连接 了 两 个 网 络 的 设备 。 这 个 特殊 的 设备 被 称 为 网 关 , 它 的 作用 是 在 不 同 的 网 络 中 转 
发 分 组 。 

操作 系统 维护 着 一 个 叫做 路 由 表 的 表格 , 它 包含 了 关于 分 组 如 何 转发 以 及 通过 网 络 中 的 哪些 
节点 转发 的 信息 。 可 以 用 下 面 的 方法 显示 路 由 表 : 


$ route 
Kernel IP routing table 


























Destination Gateway Genmask Flags Metric Ref UseIface 

192.168.0.0 过 255.255.252.0 UU 2 0 Owlan0 

link-local * 255.255.0.0 U 1000 0 Owlan0 

default p4.local 0.0.0.0 UG 0 0 Owlan0 
也 可 以 使 用 : 


$ route -n 
Kernel IP routing table 


Destination Gateway Genmask Flags Metric Ref Use Iface 
192.168.0.0 0.0.0.0 255.255.252.0 U 2 0 0 wlan0 
169.254.0.0 sss 255.255.0.0 U 1000 0 0 wlan0 
0.0.0.0 192.168.0.4 0.0.0.0 UG 0 0 0 wlan0 





-n 指 定 以 数字 形式 显示 地 址 。 如 果 使 用 -n, route 会 以 数字 形式 的 IP 地 址 显示 每 一 个 条 目 ; 否则 ， 
如 果 IP 地 址 具有 对 应 的 DNS 条 目 ， 就 会 显示 符号 形式 的 主机 名 。 


设置 默认 网 关 : 








# route add default gw IP_ ADDRESS INTERFACE NAME 
例如 : 


# route add default gw 192.168.0.1 wlan0 


7.2.4 ”参考 


口 1.3 节 讲解 了 PATH 变 量 。 
口 4.3 节 讲解 了 grep 命 令 。 





7.3 使 用 ping 
ping 是 每 位 用 户 都 应 该 首先 了 解 的 最 基础 的 网 络 命令 。 绝 大 多 数 操作 系统 上 都 包含 了 该 命 
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令 。ping 也 是 一 个 验证 网 络 上 两 台 主 机 连通 性 的 诊断 工具 ， 能 够 找 出 网 络 上 的 活动 主机 。 让 我 
们 看 看 该 命令 的 用 法 。 








7.3.1 ”实战 演练 


为 了 检查 网 络 上 两 台 主机 之 间 的 连通 性 ,ping 命 令 使 用 互联 网 控制 消息 协议 ( Internet Control 
Message Protocol, ICMP ) 中 的 echo 分 组 。 当 向 某 台 主机 发 送 echo 分 组 时 ， 如 果 分 组 能 够 送 达 且 
该 主机 人 处 于 活动 状态 ， 那 么 它 就 会 返回 一 条 回应 。 


检查 某 台 主机 是 否 可 以 到 达 








$ ping ADDRESS 


ADDRESS 可 以 是 主机 名 、 域 名 或 者 卫 地 址 。 
ping 会 连续 发 送 分 组 ， 回 应 信息 将 被 打印 在 终端 上 。 用 Ctrl+C 来 停止 ping 命 令 。 
口 如 果 主 机 可 以 到 达 ， 那 么 输出 信息 如 下 所 示 : 











$ ping 192.168.0.1 

PING 192.168.0.1 (192.168.0.1) 56(84) bytes of data. 

64 bytes from 192.168.0.1: icmp seq=1 ttlL=64 time=1.44 ms 
ee 

--- 192.168.0.1 ping statistics --- 

1 packets transmitted, 1 received, 0% packet loss, time 0ms 
rtt min/avg/max/mdev = 1.440/1.440/1.440/0.000 ms 


$ ping google.com 

PING google.com (209.85.153.104) 56(84) bytes of data. 

64 bytes from bom01s01-in-f104.1e1l00.net (209.85.153.104): icmp seq=1 ttl1l=53 
time=123 ms 

+ 

--- google.com ping statistics --- 

1 packets transmitted, 1 received, 0% packet loss, time Oms 

rtt min/avg/max/mdev = 123.388/123.388/123.388/0.000 ms 


口 如 果 主 机 不 可 到 达 ， 则 输出 如 下 所 示 : 








$ ping 192.168.0.99 

PING 192.168.0.99 (192.168.0.99) 56(84) bytes of data. 
From 192.168.0.82 icmp seq=1 Destination Host Unreachable 
From 192.168.0.82 icmp seq=2 Destination Host Unreachable 


如 果 主 机 不 可 到 达 ， ping 返 回 错 音 误 信息 “Destination Host Unreachable 。 
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KAS 网 络 管理 员 通 常会 对 路 由 器 进行 配置 ， 使 其 不 响应 ping 命 令 。 这 样 做 是 为 
了 降低 安全 风险 ， 因为 ping 可 以 被 攻击 者 (使 用 变 力 ) 用 来 获取 主机 的 了 地址。 
7.3.2 补充 内 容 


除了 检查 网 络 上 两 点 之 间 的 连通 性 ，ping 命 令 还 可 以 通过 其 他 选项 来 获取 有 用 信息 。 让 我 
们 看 看 ping 的 其 他 选项 。 


1. 往返 时 间 
ping 命 令 可 以 用 来 得 出 网 络 上 两 台 主 机 之 间 的 往返 时 间 ( Round Trip Time，RTT )。 它 是 分 组 
从 源 主机 到 目的 主机 一 来 一 回 的 时 间 。RTT 的 单位 是 毫秒 ， 该 时 间 可 以 从 ping 命 令 中 获知 。 例 如 : 


--- google.com ping statistics --- 











5 packets transmitted, 5 received, 0% packet loss, time 4000ms 
rtt min/avg/max/mdev = 118.012/206.630/347.186/77.713 ms 


其 中 ,最 小 的 RTT 是 118.012ms, 平均 RTT 是 206.630ms, 最 大 RTT 是 347.186ms。ping 输 出 中 的 mdev 
(77.713ms ) 代表 平均 偏差 ( mean deviation )。 


2. 限制 发 送 的 分 组 数量 

ping 命 令 会 不 停 地 发 送 echo 分 组 并 等 待 回复 ， 直 到 按 下 Ctrl+C 为 止 。 我 们 可 以 用 选项 -c 限 
制 所 发 送 的 echo 分 组 的 数量 。 用 法 如 下 : 

-Cc COUNT 
例如 : 


$ ping 192.168.0.1 -c 2 

PING 192.168.0.1 (192.168.0.1) 56(84) bytes of data. 

64 bytes from 192.168.0.1: icmp seq=1 ttl1l=64 time=4.02 ms 
64 bytes from 192.168.0.1: icmp seq=2 ttl=64 time=1.03 ms 








--- 192.168.0.1 ping statistics --- 
2 packets transmitted, 2 received, 0% packet loss, time 1001ms 
rtt min/avg/max/mdev = 1.039/2.533/4.028/1.495 ms 


在 上 面 的 例子 中 ，ping 命 令 发 送 了 2 个 echo 分 组 后 就 停止 发 送 。 果 我 们 需要 通过 脚本 ping 一 组 
IP 地 址 来 检查 主机 的 状态 ， 那么 这 个 技巧 就 能 派 上 用 场 了 。 


3. ping 命 令 的 返回 状态 


ping 命 令 如 果 执 行 顺利 ， 会 返回 退出 状态 0; 否则 ， 返 回 非 0。 执 行 顺利 意味 着 目的 主机 能 
够 到 达 ， 否 则 意味 着 目的 主机 不 可 到 达 
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返回 状态 可 以 通过 下 面 的 方法 轻松 获得 : 


$ ping domain -c2 
if [ $? -eq 0 1]; 
then 

echo Successful ;}; 
else 

echo Failure 
£1 


4. Traceroute 


当 应 用 程序 通过 互联 网 请 求 服 务 时 , 服务 器 可 能 位 于 远 端 , 两 者 之 间 通 过 多 个 网 关 或 设备 他 
点 相连 。 分 组 要 穿 过 这 些 网 关 才 能 到 达 目 的 地 。 有 一 个 很 有 意思 的 命令 traceroute， 它 可 以 显 
示 分 组 途径 的 所 有 网 关 的 地 址 。traceroute 信 息 可 以 帮助 我 们 搞 明白 分 组 到 达 目 的 地 需要 经 过 
多 少 跳 ( hop )。 中 途 的 网 关 或 路 由 器 的 数量 给 出 了 一 个 测量 网 络 上 两 个 节点 之 间距 离 的 度量 
(metric )。traceroute 的 输出 如 下 : 





$ traceroute google.com 

traceroute to google.com (74.125.77.104), 30 hops max, 60 byte packets 
1 gw-c6509.1xb.as5577 .net (195.26.4.1) 0.313 ms 0.371 ms 0.457 ms 

2 40g.]lxb-fra.as5577.net (83.243.12.2) 4.684 ms 4.754 ms 4.823 ms 

3 de-cix1l0.net.google.com (80.81.192.108) 5.312 ms 5.348 ms 5.327 ms 
4 209.85.255.170 (209.85.255.170) 5.816 ms 5.791 ms 209.85.255.172 
(209.85.255.172) 5.678 ms 

5 209.85.250.140 (209.85.250.140) 10.126 ms 9.867 ms 10.754 ms 

6 64.233.175.246 (64.233.175.246) 12.940 ms 72.14.233.114 
(72.14.233.114) 13.736 ms 13.803 ms 

7 72.14.239.199 (72.14.239.199) 14.618 ms 209.85.255.166 
(209.85.255.166) 12.755 ms 209.85.255.143 (209.85.255.143) 13.803 ms 
8 209.85.255.98 (209.85.255.98) 22.625 ms 209.85.255.110 
(209.85.255.110) 14.122 ms 


* 


9 ew-in-f104.1el00.net (74.125.77.104) 13.061 ms 13.256 ms 13.484 ms 





能 够 显示 实时 刷新 的 数据 。 对 于 检查 网 络 线路 质量 等 问题 很 有 帮助 。 


。 7 
| 如 今 的 Linux 发 布 版 中 还 包括 了 一 个 命令 mtr， 它 类 似 于 traceroute, 但 是 [| 
~> 能 


7.4 列 出 网 络 上 所 有 的 活动 主机 


当 我 们 管理 大 型 局 域 网 时 , 可 能 需要 检查 网 络 上 的 其 他 主机 是 否 处 于 活动 状态 。 一 台 非 活动 
主机 可 能 有 两 种 情况 : 要 么 是 没有 开机 ， 要 么 是 网 络 连接 有 问题 。 借 助 shell 脚 本 ， 我 们 可 以 轻易 
找 出 并 报告 网 络 上 的 哪 一 台 主 机 处 于 活动 状态 。 让 我 们 看 看 这 是 如 何 实现 的 。 
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7.4.1 预备 知识 


在 这 则 攻略 中 ,我 们 采用 两 种 方法 。 第 一 种 方法 使 用 ping, 第 二 种 方法 使 用 fping。 在 脚本 
中 使 用 fping 更 容易 些 ， 而 且 相 对 于 ping， 它 具有 更 多 的 特性 。fping 默 认 并 没有 包含 在 Linux 
发 布 版 中 ， 需 要 用 软件 包 管 理 器 手动 安装 。 




















7.4.2 ”实战 演练 
让 我 们 看 看 可 以 找 出 网 络 上 所 有 活动 主机 的 shell 脚 本 ， 以 及 实现 同一 目标 的 另 一 种 方法 。 
(1) 方 法 1 
我 们 可 以 用 ping 命 令 编 写 脚本 来 查询 一 组 IP 地 址 ， 检 查 它们 是 否 处 于 活动 状态 : 
#!/bin/bash 


# 文件 名 : ping.sh 
# 用 途 : 根据 网 络 配置 对 网 络 地 址 192 .168 .0 进行 修改 。 























for ip in 192.168.0.{1..255} ; 
do 
ping $ip -cc 2 &> /dev/null ; 


if [ $? -eq 0 ]; 
then 
echo $ip is alive 
£1 
done 


输出 如 下 : 

$ ./ping.sh 
192.168.0.1 is alive 
192.168.0.90 is alive 


(2) 使 用 fping 
我 们 可 以 用 已 有 的 命令 行 工 具 来 查询 网 络 上 的 主机 状态 : 





$ fping -a 192.160.1/24 -g 2> /dev/null 
192.168.0.1 
192.168.0.90 


或 者 , 使 用 : 


$ fping -a 192.168.0.1 192.168.0.255 -g 
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7.4.3 工作 原理 


在 方法 1 中 ， 我 们 用 ping 命 令 找 出 网 络 上 的 活动 主机 。 这 里 用 了 一 个 for 循 环 对 一 组 了 地址 
进行 迭代 。 这 组 也 地 址 依照 表达 式 192.168.0.{1..255} 来 生成 。 像 tstart. .end} 这 种 记 法 会 由 shell 
对 其 进行 扩展 并 生成 一 组 IP 地 址 ,例如 192.168.0.1、192.168.0.2、192.168.0.3 等 , 直到 192.168.0.255。 


ping $ip -c 2 &> /dev/null 会 在 每 次 循环 中 ping 对 应 的 人 P 地 址 。-c 2 将 发 送 的 echo 
分 组 数量 限制 为 2。&> /dev/null 用 于 将 stderr 和 stdout 重 定向 到 /dev/null， 使 对 应 的 信息 不 
会 在 终端 上 打印 出 来 。 我 们 用 $? 获取 退出 状态 。 如 果 顺 利 退 出 ， 退 出 状态 为 0， 否 则 为 非 0。 
此 能 够 ping 通 的 卫 地 址 就 被 打印 出 来 。 


在 这 个 脚本 中 ,ping 命 令 都 是 依次 执行 的 。 尽管 所 有 的 IP 地 址 都 是 彼此 独立 , 但 由 于 编写 的 
是 顺序 式 程序 (sequential program )，ping 命 令 也 只 能 按 顺 序 执行 。 每 执行 一 次 ping 命 令 ， 都 要 
经 历 一 段 延迟 : 发 送 两 个 echo 分 组 ， 接 收回 应 或 等 待 回 应 超时 。 

















7.4.4 补充 内 容 


我 们 已 经 讨论 过 了 一 种 找 出 网 络 中 所 有 活动 主机 的 方法 。 接 下 来 再 看 一 些 对 于 已 经 方法 的 改 
进 以 及 另 一 种 全 新 的 实现 方法 。 

1. 并 行 ping 

要 是 处 理 255$ 个 地 址 的 话 ， 累 积 下 来 延迟 时 间 可 就 不 得 了 。 我 们 可 以 利用 并 行 方式 来 加 速 
ping 命 令 的 执行 。 要 使 ping 命 令 可 以 并 行 执行 , 可 将 循环 体 放 入 ( )&。( ) 中 的 命令 作为 子 shell 
来 运行 ， 而 & 会 将 其 置 人 后 台 。 例 如: 

#!/bin/bash 


# 文件 名 : fast_ping.sh 
# 用 途 : 根据 网 络 配置 对 网 络 地 址 192 .168 .0 进行 修改 。 





for ip in 192.168.0.{1..255} ， 
do 
( 
ping $ip -c2 &> /dev/null ; 


if [ $2? =eg 0 ]; 
then 

echo Sip is alive 
玉宇 
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在 fo 循环 体 中 执行 多 个 后 台 进 程 ， 然 后 结束 循环 并 终止 脚本 。 要 想 等 所 有 子 进程 结束 之 后 
再 终止 脚本 ， 就 得 使 用 wait 命 令 。 将 wait 放 在 脚本 最 后 ， 它 就 会 一 直 等 到 所 有 的 子 脚本 进程 全 
部 结束 。 

2. 使 用 fping 

第 二 种 方法 使 用 了 男 一 个 命令 fping。 它 同时 可 以 ping 一 组 IP 地 址 ， 而 且 响 应 速度 非常 快 。 
fping 的 选项 如 下 : 
口 选项 -a 指 定 打印 出 所 有 活动 主机 的 卫 地 址 ; 
口 选项 -u 指 定 打 印 出 所 有 无 法 到 达 的 主机 ; 
口 选项 -g 指 定 从 "IP 地 址 / 子 网 掩 码 " 记 法 或 者 "IP 地 址 范围 " 记 法 中 生成 一 组 IP 地 址 ; 






































$ fping -a 192.160.1/24 -g 
或 者 
$ fping -a 192.160.1 192.168.0.255 -g 
口 2>/dev/null1 将 由 于 主机 无 法 到 达 所 产生 的 错误 信息 打印 到 null 设 备 。 
也 可 以 采用 命令 行 参数 的 方式 手动 指定 一 组 IP 地 址 ,或 者 从 stain 中 接收 。 例 如 : 


$ fping -a 192.168.0.1 192.168.0.5 192.168.0.6 
# 将 IP 地 址 作为 参数 传递 

$ fping -a < ip.list 

# 从 文件 中 传递 一 组 IP 地 址 








7.4.5 ”参考 


口 1.6 节 讲解 了 数据 重 定向 。 
口 1.17 节 讲解 了 数字 比较 。 

















7.5 ”使 用 SSH 在 远程 主机 上 运行 命令 


SSH 是 一 个 很 有 意思 的 系统 管理 工具 ， 它 能 够 让 你 访问 远程 计算 机 上 的 shell， 进 而 执行 各 种 
命令 。SSH 是 Secure Shell 的 缩写 ， 因 为 它 使 用 加 密 通 道 来 传输 网 络 数据 。 这 则 攻略 介绍 了 在 远程 
主机 上 运行 命令 的 各 种 方法 。 





7.5.1 预备 知识 


GNU/Linux 发 布 版 中 默认 都 不 包括 SSH， 需 要 使 用 软件 包 管 理 器 安装 openssh-server 和 
openssh-client 软 件 包 。SSH 服 务 默认 运行 在 端口 22 之 上 。 
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7.5.2 ”实战 演练 
(1) 连接 运行 SSH 服 务 器 的 远程 主机 : 


$ ssh username@remote host 
其 中 : 


D username 是 远程 主机 上 的 用 户 ; 
口 remote_host 可 以 是 域名 或 PP 地 址 。 


例如 : 


$ ssh mec@192.168.0.1 

The authenticity of host '192.168.0.1 (192.168.0.1)' can't be established. 
RSA key fingerprint is 2b:b4:90:79:49:0a:fl:b3:8a:db:9£f:73:2d:75:d6:f£9. 
Are You sure you want to continue connecting (yes/no)? yes 

Warning: Permanently added '192.168.0.1' (RSA) to the list of known hosts. 
Password: 











Last login: Fri Sep 3 05:15:21 2010 from 192.168.0.82 
mec@proxy-1:~$ 


ssh 采 用 交互 方式 询问 用 户 密码 ， 一 旦 认证 成 功 ， 将 会 为 用 户 返 回 一 个 shell。 





SSH 执 行 指纹 核对 (fingerprint verification ) 来 确保 用 户 连接 到 正确 

的 远程 主机 。 这 是 为 了 避免 中 间 人 攻击 (man-in-the-middle attack )， 在 
一 ”这 类 攻击 中 ， 攻 击 者 试图 假扮 成 另 一 台 计 算 机 。 在 第 一 次 连接 到 服务 

器 上 时 ，SSH 默 认 会 存储 指纹 信息 ， 在 今后 的 连接 过 程 中 核对 该 指纹 。 


SSH 服 务 器 默认 在 端口 22 上 运行 。 但 有 些 SSH 服 务 器 并 没有 使 用 这 个 端口 。 针 对 这 种 


情况 ， 可 以 用 SSH 的 -p port_num 来 指定 端口 。 2 
7 
(2) 连接 运行 在 端口 422 之 上 的 SSH 服 务 器 : 








$ ssh user@locahost -p 422 


你 可 以 在 远程 主机 的 shell 中 执行 命令 。 但 是 在 shell 脚 本 中 使 用 SSH 时 , 并 不 需要 交互 
式 的 shell， 因 为 我 们 需要 执行 多 条 命令 并 显示 或 存储 命令 输出 。 




















人 因此 要 对 
a SSH 进 行 无 密码 登录 配置 。7.8 节 将 讲解 具体 的 配置 方法 。 
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G) 


(4) 





要 想 在 远程 主机 中 执行 命令 ， 并 将 命令 输出 显示 在 本 地 shell 中 ， 使 用 下 面 的 语法 : 
$ ssh user@host 'COMMANDS' 

例如 : 

$ ssh mec@192.168.0.1 'whoami' 

mec 





可 以 输入 多 条 命令 ， 在 命令 之 间 以 分 号 进行 分 隔 : 
$ ssh user@host "command1 ; command2 ; command3" 
例如 : 


$ ssh mec@192.168.0.1 "echo user: $(whoami);echo 0S: $ (uname)" 
Password: 
user: mec 
OS: Linux 


在 这 个 例子 中 ， 在 远程 主机 上 执行 的 命令 是 : 








echo user: $(whoami); 
echo OS: $ (uname) 


写成 一 般 的 形式 就 是 : 


COMMANDS="commandl1l; command2; command3" 
$ ssh user@hostname "$COMMANDS" 


我 们 也 可 以 在 命令 序列 中 用 子 shell 操 作 符 传递 一 个 更 复杂 的 子 shell。 


ee 个 基于 SSH 的 shell 脚 本 ， 它 用 来 收集 一 组 远程 主机 的 运行 时 间 
( uptime )。 运 行 时 间 是 系统 加 电 运 行 的 时 间 ，uptime 命 令 可 以 用 来 显示 系统 加 电 后 
假设 在 IP_LIsT 中 的 所 有 系统 都 有 一 个 用 户 test。 


#!/bin/bash 
# 文件 名 : uptime.sh 
# 用 途 : 系 统 运行 时 间 监 视 器 











IP LIST="192.168.0.1 192.168.0.5 192.168.0.9" 
USER="test" 


for IP in $IP LIST; 

do 
utime=$ (ssh ${USER}@S$S{IP} uptime | awk '{ print $3 }' ) 
echo $IP uptime: Sutime 

done 
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输出 如 下 : 
$ ./uptime.sh 
192.168.0.1 uptime: 1:50, 


192.168.0.5 uptime: 2:15, 
192.168.0.9 uptime: 10:15, 


7.5.3 ”补充 内 容 
让 我 们 看 看 ssh 命 令 的 男 一 些 选 项 。 
1. SSH 的 压缩 功能 


SSH 协 议 也 支持 对 数据 进行 压缩 传输 。 当 带宽 有 限时 ， 这 一 功能 很 方便 。 用 ssh 命 令 的 选项 
-C 启 用 这 一 功能 : 


$ ssh -C user@hostname COMMANDS 
2. 将 数据 重 定向 至 远程 shell 命 令 的 stain 
有 时 候 我 们 需要 将 一 些 数据 重 定向 到 远程 shell 命 令 的 stain。 下 面 是 实现 方法 : 




















$ echo 'text' | ssh user@remote host 'echo' 
text 


或 者 


# 将 文件 中 的 数据 进行 重 定向 

$ ssh user@remote host 'echo' < file 
在 远程 主机 上 ，echo 打 印 出 通过 stdin 接 收 到 的 数据 ， 但 这 些 数据 却 是 从 本 地 主机 传递 到 远程 
shell 的 stqin 中 的 。 


3. 在 远程 主机 中 执行 图 形 化 命令 


如 果 你 打算 使 用 刚才 介绍 过 的 方法 来 运行 一 些 需 要 显示 某 种 形式 的 GUI 的 命令 ， 就 会 碰 上 类 
似 于 “无 法 显示 ”之 类 的 错误 。 这 是 因为 ssh shell 无 法 连接 到 远程 主机 上 的 X 服 务 器 。 对 此 , 你 需 
要 像 这 样 设置 变量 SDTSPLAY: 









































ssh user@host "export DISPLAY=:0 ; command1; command2""" 


这 将 启用 远程 主机 上 的 图 形 化 输出 。 如 果 你 想 在 本 地 主机 上 也 显示 图 形 化 输出 ， 使 用 SSH 的 X11 
转发 选项 ( forwarding option ): 





ssh -xX user@host "commandl; command2" 


该 命令 会 在 远程 主机 上 执行 ,但 图 形 化 输出 会 显示 在 本 地 主机 上 。 
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7.5.4 ”参考 
7.8 节 讲解 了 如 何 实现 在 不 输入 密码 的 情况 下 ， 自 动 登录 执行 远程 命令 。 


7.6 通过 网 络 传输 文件 


计算 机 联网 的 主要 目的 就 是 资源 共享 。 在 资源 共享 方面 , 使 用 最 多 的 是 文件 共享 。 有 多 种 方 
法 可 以 用 来 在 网 络 中 传输 文件 。 这 则 攻略 就 讨论 了 如 何 用 常见 的 协议 FTP、SFTP、RSYNC 和 SCP 
传输 文件 。 























7.6.1 预备 知识 


用 来 在 网 络 上 传输 文件 的 命令 多 数 都 已 默认 包含 在 安装 好 的 Linux 中 。 通 过 FTP 传 输 文件 可 以 
使 用 1ftp 命 令 ， 通过 SSH 连 接 传输 文件 可 以 使 用 sftp，RSYNC 使 用 SSH 与 rsync 命 令 ， scp 通 
过 SSH 进 行 传输 。 











7.6.2 ”实战 演练 

文件 传输 协议 (File Transfer Protocol，FTP ) 是 一 个 古老 的 用 于 在 网 络 主机 之 间 传 输 文件 的 
文件 传输 协议 。 我 们 可 以 用 1ftp 命 令 访问 FTP 服 务 器 来 进行 文件 传输 。 只 有 远程 主机 上 安装 有 
FTP 服 务 器 才能 使 用 FTP。 很 多 公共 网 站 都 是 用 FTP 共 享 文件 ， 它 使 用 端口 21。 

要 连接 FTP 服 务 器 传输 文件 ， 可 以 使 用 : 


$ lftp username@ftphost 

它 会 提示 你 输入 密码 ， 然 后 显示 一 个 像 下 面 那 样 的 登录 提示 符 : 
lftp username@ftphost:~> 
你 可 以 在 提示 符 后 输入 命令 ， 如 下 所 示 。 

口 用 ca airectory 改 变 目录 。 

口 用 1cq 改 变 本 地 主机 的 目录 。 

口 用 mkgir 创 建 目 录 。 

口 列 出 远程 机 器 当前 目录 下 的 文件 使 用 Ts。 

口 用 get filename 下 载 文件 : 





lftp username@ftphost:~> get filename 


口 用 put filename 从 当前 目录 上 传 文件 : 





lftp username@ftphost:~> put filename 
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口 用 suit 退出 1ftp 会 话 。 


1ftp 提 示 符 支持 命令 自动 补 全 。 


7.6.3 ”补充 内 容 
让 我 们 看 看 其 他 可 用 于 网 络 文件 传输 的 技术 及 命令 。 
1. FTP 自 动 传输 


ftp 是 另 一 个 可 用 于 FTP 文 件 传 输 的 命令 。 相 比较 而 言 ，1ftp 的 用 法 更 灵活 。1ftp 和 ftp 为 
用 户 启动 一 个 交互 式 会 话 ( 通过 显示 消息 来 提示 用 户 输入 )。 如 果 我 们 不 使 用 交互 模式 ， 而 是 希 
望 进行 自动 文件 传输 ， 又 该 怎么 做 呢 ?” 下 面 的 脚本 可 以 用 来 实现 FTP 自 动 传输 : 

















#!/bin/bash 

# 文件 名 : ftp.sh 

# 用 途 : 自动 化 FTP 传输 
HOST= 'Qomain .com' 
USER= 'foo ' 
PASSWD='password' 

ftp -i -n SHOST <<EOF 
user ${USER} S${PASSWD} 
binary 











cd /home/slynux 
puttestfile.jpg 
getserverfile.jpg 
quit 

EOF 


上 面 的 脚本 包含 下 列 结构 : 


<<EOF 
DATA 
EOF 


这 是 用 来 通过 stdin 向 FTP 命 令 发 送 数据 。1.6 节 中 已 讲解 了 重 定向 到 stain 的 各 种 方法 。 























在 示例 脚本 中 ，ftp 的 选项 -i 关闭 用 户 的 交互 会 话 ，user StUsER} ${PASSWDj 设 置 用 户 
名 和 密码 ，binary 将 文件 模式 设置 为 二 进 制 模式 。 








2. SFTP (Secure FTP， 安 全 FTP) 
SFTP 是 一 个 类 似 于 FTP 的 文件 传输 系统 ， 它 运行 在 SSH 连 接 之 上 并 模拟 成 FTP 接 口 。 它 不 需 
要 远 端 运行 FTP 服 务 器 来 进行 文件 传输 , 但 必须 安装 并 运行 OpenSSH 服 务 器 。SFTP 是 一 个 交互 式 


命令 ， 提 供 了 命令 提示 符 。 
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下 面 的 命令 可 用 于 文件 传输 。 对 于 特定 主机 、 用 户 和 密码 的 自动 化 FTP 会 话 来 说 ， 命 令 都 是 
一 样 的 [oe 





cd /home/slynux 
put testfile.jpg 
get serverfile.jpg 


运行 sftp: 
$ sftp user@domainname 
和 1ftp 类 似 ， 输 入 quit 命 令 可 以 退出 sftp 会 话 。 


SSH 服 务 器 有 时 候 并 不 在 默认 的 端口 2 上 运行 。 如 果 它 在 其 他 端口 运行 ， 我 们 可 以 在 sftp 
中 用 -oPort=PORTNO 来 指定 端口 号 。 例 如 : 








$ sftp -oPort=422 user@slynux.org 


-oPort 应 该 作为 sftp 命 令 的 第 一 个 参数 。 





3. rsync 命 邻 


作为 一 款 重要 的 命令 行 工具 ，rsync 广 泛 用 于 网 络 文件 复制 及 系统 备份 。6.8 节 详细 讲解 了 
rsync 的 用 法 。 





4. SCP (Secure Copy Program， 安 全 复制 程序 ) 


传统 的 远程 复制 工具 rcp 而 言 ，SCP 是 一 项 更 安全 的 文件 复制 技术 。 文 件 均 通 过 SSH 加 密 
通道 进行 传输 。 我 们 可 以 像 下 面 这 样 轻松 地 将 文件 传输 到 远程 主机 : 




















ok 




















$ scp filename user@remotehost:/home/path 
该 命令 会 提示 你 输入 密码 , 可 以 用 SSH 自 动 登录 功能 来 免 于 输入 密码 。7.8 节 会 讲解 SSH 自 动 登录 。 
因此 ， 用 scp 传 输 文件 无 需 特定 的 脚本 。 一 旦 实现 了 SSH 自 动 登 录 ，scp 就 可 以 直接 执行 ， 而 不 
再 需要 提示 输入 密码 。 


命令 中 的 remotehost 可 以 是 IP 地 址 或 域名 。scp 命 令 的 格式 是 : 























$ scp SOURCE DESTINATION 
SOURCE 或 DESTINATION 可 以 采用 形 如 username@1ocalhost:/path 的 格式 。 例 如 : 
$ scp user@remotehost:/home/path/filename filename 
上 面 的 命令 将 远程 主机 中 的 文件 复制 到 当前 目录 ， 并 采用 给 定 的 文件 名 。 
如 果 SSH 没 有 运行 在 端口 22， 使 用 -oPort， 并 采用 和 sftp 相 同 的 语法 。 
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5. 用 scP 进 行 递 归 复 制 
使 用 scp 的 -z 选 项 ， 我 们 可 以 在 两 台 网 络 主机 之 间 对 文件 夹 进行 递归 复 


$ scp -r /home/slynux UserGQremotehost : /home/backups 


# 将 目录 /home/slynux 递 归 复 制 到 远程 主机 中 
scp 的 -p 选 项 能 够 在 复制 文件 的 同时 保留 文件 的 权限 和 模式 。 


| : 





蛋 


7.6.4 ”参考 
1.6 节 讲解 了 如 何 用 EOF 实 现 标准 输入 。 


7.7 连接 无 线 网 络 


配置 以 太 网 很 简单 ， 因 为 它 使 用 物理 线 绕 ， 无 需 认 证 之 类 的 特殊 要 求 。 但 是 无 线 LAN 可 能 就 
得 进行 认证 了 , 比如 WEP 密 钥 以 及 所 要 连接 的 无 线 网 络 的 ESSID ( Extended Service Set Identification， 
扩展 服务 集 标识 )。ESSID 是 无 线 网 络 的 名 称 。 让 我 们 看 看 如 何 用 脚本 来 连接 无 线 网 络 。 























7.7.1 预备 知识 


我 们 需要 用 ifconfig 分 配 IP 地 址 和 子 网 掩 码 才能 连接 上 有 线 网 络 。 对 于 无 线 网 络 来 说 ， 还 
需要 其 他 工具 ( 如 iwconfig 和 iwlist ) 来 配置 更 多 的 参数 。 





7.7.2 ”实战 演练 
连接 启用 了 WEP ( Wried Equivalent Privacy， 有 线 等 效 加 密 ) 的 连接 无 线 LAN 的 脚本 如 下 : 


#!1/bin/bash 
# 文 件 名 : wlan_connect.sh 
# 用 途 : 连接 无 线 LAN 


# 根 据 你 的 设置 修改 下 面 的 参数 

划 提 提 扩 并 间 #### PARAMETERS 提 提 提 ###### 井 提亲 提 提 
IFACE=wlan0 

IP_ADDR=192.168.1.5 

SUBNET_ MASK=255.255.255.0 
GW=192.168.1.1 
HW_ADDR='00:1c:bf:87:25:d2"' 

# 如 果 不 想 使 用 物理 地 址 欺骗 ， 把 上 面 这 一 行 注释 掉 











ESSID="homenet" 

WEP_ KEY=8b140b20e7 

FREQ=2 .462G 

划 扩 提 夺 六 提 扩 提 提 扩 并 提 扩 提 提 扩 提 提 扩 提 失 提 井 守 并 提 扩 提 划 扩 井 划 窒 
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pa 


EY_PART="" 





if [[ -n SWEP_KEY ]]; 
then 
KEY_PART="key SWEP_KEY" 








下 主 
# 设 置 新 的 配置 之 前 先 关闭 接口 
/sbin/ifconfig $IFACE down 


if [ SUID -ne 0 ]; 
then 
echo "Run as root" 


exit 1; 
下 
if [[ -n S$HW_ADDR 1]1; 
then 


/sbin/ifconfig SIFACE hw ether S$HW_ADDR 
echo Spoofed MAC ADDRESS to S$HW_ADDR 
下 二 


/sbin/iwconfig SIFRACE essid SESSID SKEY_PART freq S$FREQ 





/sbin/ifconfig SIFACE SIP_ADDR netmask S$SUBNET MASK 
route add default gw SGW $IFACE 


echo Successfully configured $IFACE 


7.7.3 工作 原理 


命令 i fconfig.、 iwconfig 和 route 必 须 以 root 用 户 身份 运行 ; 因此 在 脚本 一 开始 要 检查 是 
否 为 root 用 户 。 


无 线 LAN 需 要 essid、 密 钥 、 频 率 等 参数 。essid 是 我 们 想 要 连接 的 无 线 网 络 的 名 称 。 一 些 
网 络 需 要 用 WEP 密 钥 进 行 认证 ，WEP 密 钥 通常 是 一 个 5 位 或 10 位 十 六 进 制 数 口令 。 频 率 则 是 分 配 
给 特定 网 络 的 ，iwconfig 命 令 用 它 将 无 线 网 卡 同 对 应 的 无 线 网 络 联系 起 来 。 


我 们 可 以 用 iwlist 工 具 扫描 并 列 出 可 用 的 无 线 网 络 。 用 下 面 的 命令 进行 扫描 : 








# iwlist scan 


wlan0 Scan completed : 
Cell 01 - Address: 00:12:17:7B:1C:65 
Channel:11 


Frequency:2.462 GHz (Channel 11) 
Quality=33/70 Signal level=-77 dBm 
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Encryption key:on 
ESSID: "model-2" 


可 以 从 扫描 结果 中 的 Frequency:2.462 GHz (Channel 11) 一 行 中 提取 频率 参数 。 


为 简单 起 见 这 个 示例 使 用 WEP， 但 需要 说 明 的 是 ， 就 目前 来 讲 WEP 是 不 安 
KW 全 的 。 如 果 你 要 负责 管理 无 线 网 络 ， 最 好 使 用 Wi-Fi 保 护 访问 2( WPA2 ) 加 密 方 
式 式 ， 以 确保 安全 。 


7.7.4 参考 
1.17 节 讲解 了 字符 串 比较 。 


7.8 用 SSH 实现 无 密码 自动 登录 


SSH 广 泛 用 于 脚本 自动 化 ， 它 使 得 我 们 可 以 在 远程 主机 上 执行 命令 并 读 取 输 出 。SSH 通 常 使 
用 用 户 名 和 密码 进行 认证 , 在 其 执行 过 程 中 会 提示 输入 密码 。 但 是 在 自动 化 脚本 中 要 求 用 户 输入 
密码 就 显然 不 实际 了 。 因 此 需要 将 登录 过 程 自动 化 。SSH 人 包含 了 一 个 内 建 特性 ， 可 以 用 SSH 密 钥 
实现 自动 登录 。 这 则 攻略 描述 了 如 何 创建 SSH 窗 钥 并 协助 实现 自动 登录 。 





























7.8.1 预备 知识 


SSH 采 用 了 非 对 称 加 密 技术 ， 认 证 密 钥 包 含 两 部 分 : 一 个 公 钥 和 一 个 私 钥 。 我 们 可 以 通过 
ssh-keygen 命 令 创 建 认证 密 钥 。 要 想 实现 自动 化 认证 ， 公 钥 必 须 放 置 在 服务 器 中 (将 其 加 入 文件 
~/ssh/authorized keys )， 与 公 钥 对 应 的 私 钥 应 该 放 人 登录 客户 机 的 ~/ssh 目 录 中 。 另 一 些 与 SSH 相 关 的 
配置 信息 ( 例如 ，arthorized_ keys 文件 的 路 径 与 名 称 ) 可 以 通过 修改 文件 /etc/ssh/sshd_config 进 行 配置 。 

















7.8.2 ”实战 演练 
设置 SSH 自 动 化 认证 需要 两 步 : 
(1) 创建 SSH 密 钥 ， 这 用 于 登录 远程 主机 ; 
(2) 将 生成 的 公 钥 传 给 远程 主机 ， 并 将 其 加 入 文件 ~/.ssh/authorized_keys 中 。 
输入 命令 ssh-keygen 创 建 SSH 密 钥 ， 并 指定 加 密 算法 类 型 为 RSA: 


$ ssh-keygen -t rsa 




















Generating public/private rsa key pair. 
Enter file in which to save the key (/home/slynux/.ssh/id rsa): 
Created directory '/home/slynux/.ssh'. 
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Enter passphrase (empty for no passphrase): 

Enter same passphrase again: 

Your identification has been saved jin /home/slynux/.ssh/id rsa. 

Your public key has been saved in /home/slynux/.ssh/id rsa.pub. 

The key fingerprint is: 
£7:17:c6:4d:c9:ee:17:00:af:0f:b3:27:a6:9c:0a:05 slynux@slynux-laptop 
The key's randomart image is: 


+--[ RSA 2048]----+ 
| 。 | 
| 全 | 
| E © o.| 
| oo | 

| S .+ +o.| 
| | 

| a 和 | 
| .+ | 
+----------------- 十 





I 








你 需要 输入 一 个 口令 来 生成 一 对 公 钥 和 私 钥 。 如 果 不 输入 的 话 , 也 可 以 生成 密 钥 , 但 是 这 机 
做 可 不 安全 。 我 们 可 以 编写 监控 脚本 ,利用 自动 登录 来 登入 多 台 主 机 。 对 于 这 种 情况 ， 在 运行 
ssh-keygen 命 令 时 ， 不 要 填 和 人 口令， 这 样 就 能 够 避免 在 脚本 运行 时 向 你 索要 口令 了 。 


现在 ~/.ssh/id_rsa.pub 和 ~/.ssh/id_rsa 已 经 生成 了 。id_dsa.pub 是 生成 的 公 钥 ，id_dsa 是 生成 的 
私 钥 。 公 钥 必 须 添加 到 远程 服务 器 ~/.ssh/authorized keys 文 件 中 ， 这 台 服 务 器 也 正 是 我 们 想 从 当 
前 主机 自动 登入 的 那 台 服务 器 。 


要 添加 一 个 密 钥 文 件 ， 可 以 使 用 : 











$ ssh USER@REMOTE HOST "cat >> ~/.ssh/authorized keys" < ~/.ssh/id rsa.pub 
Password: 


在 上 面 的 命令 中 要 提供 登录 密码 。 


自动 登录 就 已 经 设置 好 了 。 从 现在 开始 ，SSH 在 运行 过 程 中 就 不 会 再 提示 输入 密码 。 你 可 以 
用 下 面 的 命令 来 测试 : 





$ ssh USER@REMOTE HOST uname 
Linux 


这 样 就 不 会 提示 你 输入 密码 了 。 


多 数 Linux 发 布 版 中 有 一 个 叫做 ssh-copy-id 的 工具 , 它 可 以 自动 将 私 钥 加 入 远 


< 
| 程 服务 器 的 authorized keys 文件 中 。 用 法 如 下 : 


ssh-copy-id USER@REMOTE_ HOST 
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7.9 使 用 SSH 进行 端口 转发 


端口 转发 允许 其 他 计算 机 利用 你 的 主机 来 连接 到 远程 服务 器 上 的 特定 服务 。 举 例 而 言 , 假设 
你 的 主机 分 配 的 耳 地 址 是 192.168.1.2， 而 且 还 拥有 互联 网 连接 。 如 果 你 将 主机 端口 8000 上 的 流量 
转发 到 www.kernel.org 的 端口 80 上 ， 那 么 其 它 计 算 机 就 可 以 使 用 浏览 器 通过 访问 http://192.168. 
1.2:8000 来 进入 Linux 内 核 站 点 了 。 来 看 看 如 何 实现 这 一 切 。 





7.9.1 实战 演练 
你 可 以 将 本 地 主机 端口 上 的 流量 转发 到 另 一 台 主 机 上 , 也 可 以 将 远程 主机 端口 上 的 流量 转发 
到 其 它 主 机 。 按 照 下 面 的 方法 ， 一 旦 端口 转发 设置 完毕 ， 你 会 得 到 一 个 shell 提 示 符 。 在 进行 转发 
的 过 程 中 , 这 个 shell 必 须 保 持 打开 状态 , 什么 时 候 想 停止 端口 转发 , 只 需要 退出 该 shell 就 可 以 了 。 
(1) 使 用 下 列 命 令 将 本 地 主机 端口 8000 上 的 流量 转发 到 www.kernel.org 的 端口 80 上 : 
ssh -L 8000:www.kernel.org:80 user@localhost 
将 上 述 命令 中 的 user 替 换 成 本 地 主机 上 的 用 户 名 。 
(2) 使 用 下 列 命 令 将 远程 主机 端口 8000 上 的 流量 转发 到 www.kernel.org 的 端口 80 上 : 
ssh -L 8000:www.kernel.org:80 user@REMOTE MACHINE 


将 上 述 命 令 中 的 REMOTE_MACHINE 替 换 成 远程 主机 的 主机 名 或 IP 地 址 , 将 user 替 换 成 
使 用 SSH 进 行 访问 的 用 户 名 。 




















7.9.2 补充 内 容 
使 用 非 交互 模式 或 者 反 向 端口 转发 可 以 使 端口 转发 发 挥 更 大 的 作用 。 来 看 一 看 这 两 者 的 用 法 。 
1. 非 交互 式 端口 转发 


如 果 你 只 是 想 设置 端口 转发 ， 而 不 希望 总 是 保持 一 个 打开 状态 的 shell,， 那么 可 以 像 下 面 这 样 
使 用 ssh: 


ssh -ED 8000:www.kernel .org:80 user@localhost -N 


-E 指 定 ssh 在 执行 命令 前 转 人 后台 运行 ，-L 指 定 远 程 主机 的 登录 名 ，-N 告 诉 ssh 无 需 执行 命令 ， 
只 进行 端口 转发 。 


2. 反 向 端口 转发 
反 向 端口 转发 是 SSH 最 强大 的 特性 之 一 。 如 果 你 有 一 台 无 法 通过 互联 网 进行 访问 的 主机 , 但 
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是 又 希望 其 他 用 户 可 以 访问 到 这 台 主 机 上 的 服务 , 那 就 是 反 向 端口 转发 大 显 身手 的 时 候 了 。 如 果 
你 使 用 SSH 访 问 一 台 可 以 通过 互联 网 访问 的 远程 主机 , 那么 就 可 以 在 这 台 主 机 上 设置 反 向 端口 转 
发 ， 将 流量 转发 到 运行 服务 的 本 地 主机 上 。 

反 向 端口 转发 的 设置 同 端口 转发 非常 类 似 : 

ssh -R 8000:localhost:80 user@REMOTE MACHINE 
上 述 命令 会 将 远程 主机 端口 8000 上 的 流量 转发 到 本 地 主机 的 端口 80 上 。 和 之 前 一 样 ， 别 忘 了 把 
REMOTE_MACHINE 替 换 成 远程 主机 的 主机 名 或 IP 地 址 。 
利用 这 种 方法 ,如果 你 在 远程 主机 上 浏览 http://localhost, 那么 实际 连接 的 是 运行 在 本 地 主机 
端口 8000 上 的 Web 服 务 右 。 









































7.10 在 本 地 挂 载 点 上 挂 载 远程 驱动 器 


在 执行 数据 读 写 操作 时 , 如 果 可 以 通过 本 地 挂 载 点 访问 远程 主机 文件 系统 , 那 就 再 好 不 过 了 。 
SSH 是 网 络 中 最 常用 的 文件 传输 协议 ， 因 此 可 以 利用 它 和 sshfs 来 实现 这 一 需求 。sshfs 人 允许 你 
将 远程 文件 系统 挂 载 到 本 地 挂 载 点 上 。 让 我 们 看 看 实现 方法 。 























7.10.1 预备 知识 


GNU/Linux 发 布 版 默认 并 不 包含 sshfs。 请 使 用 软件 包 管 理 器 来 自行 安装 。sshfs 是 FUSE 
文件 系统 软件 包 的 一 个 扩展 ， 人 允许 它 支 持 的 操作 系统 像 使 用 本 地 文件 系统 一 样 挂 载 各 类 数据 。 


有 关 FUSE 更 多 的 信息 ， 请 访问 http://fuse.sourceforge.net/。 











7.10.2 ”实战 演练 
将 位 于 远程 主机 上 的 文件 系统 挂 载 到 本 地 挂 载 点 上 : 


# sshfs -o allow other user@remotehost:/home/path /mnt/mountpoint 
Password: 


在 收 到 提示 时 输入 用 户 密 码 。 现 在 位 于 远程 主机 /home/path 中 的 数据 就 可 以 通过 本 地 挂 载 点 
/mnt/mountpoint 来 访问 了 。 


完成 任务 后 ， 可 用 下 面 的 方法 和 印 载 : 
# umount /mnt/mountpoint 
7.10.3 ”参考 


7.5 节 讲解 了 ssh 命 令 。 





7.11 网 络 流量 与 端口 分 析 


网 络 端口 是 网 络 应 用 程序 必 不 可 少 的 参数 。 应 用 程序 在 主机 上 打开 端口 , 通过 远程 主机 中 打 
开 的 端口 实现 远程 通信 。 出 于 安全 方面 的 考虑 ,必须 留意 系统 中 开放 及 关闭 的 端口 。 恶 意 软件 和 
Rootkit 可 能 会 利用 特定 的 端口 及 服务 运行 在 系统 中 , 从 而 使 攻击 者 可 以 对 数据 及 资源 进行 未 经 授 
权 的 访问 。 通 过 获取 开放 端口 列表 以 及 运行 在 端口 之 上 的 服务 ， 人 而 且 
这 些 信 息 还 有 助 于 对 其 进行 清除 。 开 放 端口 列表 不 仅 能 够 协助 检测 恶意 软件 ,而 且 还 能 够 收集 开 
放 端 口 的 相关 信息 , 以 便 调 试 网 络 应 用 程序 。 它 可 以 用 来 分 析 端 口 连接 及 端口 侦 听 功能 是 否 正常 。 
这 则 攻略 讨论 了 各 种 用 于 端口 分 析 的 工具 。 















































7.11.1 预备 知识 


很 多 命令 可 用 来 列 出 端口 以 及 运行 在 端口 上 的 服务 ( 例如 1sof 和 netstat )。 这 些 命 令 都 默 
认 包 含 在 所 有 的 GNU/Linux 发 布 版 中 。 








7.11.2 ”实战 演练 
要 列 出 系统 中 的 开放 端口 以 及 运行 在 端口 上 的 服务 的 详细 信息 ， 可 以 使 用 以 下 命令 








$ lsof -i 

COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME 

firefox-b 2261 slynux 78u IPv4 63729 0t0 TCP localhost:47797- 
>localhost:42486 (ESTABLISHED) 

firefox-b 2261 slynux 80u IPVv4 68270 0t0 TCP slynux-laptop. 
local:41204->192.168.0.2:3128 (CLOSE WAIT) 

firefox-b 2261 slynux 82u IPVv4 68195 0t0 TCP slynux-laptop. 
local:41197->192.168.0.2:3128 (ESTABLISHED) 

ssh 3570 slynux 3u IPv6 30025 0t0 TCP localhost:39263- 
>localhost:ssh (ESTABLISHED) 

ssh 3836 slynux 3u IPV4 43431 0t0 TCP slynux-laptop. 
local:40414->boneym.mtveurope.org:422 (ESTABLISHED) 

GoogleTal 4022 slynux l2u IPVv4 55370 0t0 TCP localhost:42486 
(LISTEN) 

GoogleTal 4022 slynux l3u IPVv4 55379 0t0 TCP localhost:42486- 


>localhost:32955 (ESTABLISHED) 
1sof 的 每 一 项 输出 都 对 应 着 一 个 打开 了 特定 端口 的 服务 。 输 出 的 最 后 一 列 类 似 于 : 


laptop.local:41197->192.168.0.2:3128 

















输出 中 的 laptop .local:41197 对 应 本 地 主机 ，192 .168.0.2:3128 对 应 远程 主机 。41197 是 
本 地 主机 当前 的 开放 端口 ，3128 是 连接 远程 主机 服务 所 需要 使 用 的 端口 。 
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要 列 出 本 地 主机 当前 的 开放 端口 ， 可 以 使 用 : 





$ lsof -i | grep ":[0-9]\+->" -o | grep "[0-9]\+" -o | sort | unig 


7.11.3 ”工作 原理 


第 一 个 grep 中 使 用 的 正则 表达 式 : [0-9]\+-> 用 来 从 1sof 输 出 中 提取 主机 端口 部 分 
( :34395-> ); 第 二 个 grep 用 来 提取 端口 号 ( 数字 )。 同 一 个 端口 可 能 会 有 多 个 连接 ， 因 此 相同 
的 端口 也 许 会 出 现 多 次 。 为 了 保证 每 个 端口 只 显示 一 次 ， 将 端口 号 排序 并 打印 出 不 重复 的 部 分 。 

















7.11.4 补充 内 容 
让 我 们 看 看 另 一 些 用 来 查看 开放 端口 以 及 网 络 流 量 相 关 信 息 的 工具 。 
用 netstat 查 看 开放 端口 与 服务 


netstat 是 另 一 个 可 用 于 网 络 服务 分 析 的 命令 。 讲 解 netstat 的 所 有 特性 超出 了 这 则 攻略 的 
范围 。 这 里 只 看 如 何 用 它 列 出 服务 与 端口 号 。 
用 netstat -tnp 列 出 开放 端口 与 服务 : 


$ netstat -tnp 
(Not all processes could be identified, non-owned process info 














will not be shown, you would have to be root to see it all.) 
Active Internet connections (w/o servers) 


Proto Recv-Q Send-Q Local Address Foreign Address State 
PID/Program name 

tcp 0 0 192.168.0.82:38163 192.168.0.2:3128 

ESTABLISHED 2261/firefox-bin 

tcp 0 0 192.168.0.82:38164 192.168.0.2:3128 TIME 
WAIT 一 

tcp 0 0 192.168.0.82:40414 193.107.206.24:422 
ESTABLISHED 3836/ssh 

tcp 0 0 127.0.0.1:42486 127.0.0.1:32955 

ESTABLISHED 4022/GoogleTalkPlug 

tcp 0 0 192.168.0.82:38152 192.168.0.2:3128 

ESTABLISHED 2261/firefox-bin 

tcp6 0 0 sls22 $1:39263 

ESTABLISHED - 

tcp6 0 0 ss1:39263 ss1s22 


ESTABLISHED 3570/ssh 


7.12 创建 套 接 字 
对 于 已 有 的 应 用 ， 例 如 文件 传输 、 远 程 shell 等 ， 我 们 有 现成 的 工具 可 以 使 用 ( ftp 和 ssh )。 
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但 有 时 候 你 可 能 需要 一 些 定制 的 网 络 应 用 。 比 如 写 一 个 脚本 ， 当 远程 客户 连接 到 主机 时 执行 某 些 
操作 。 在 这 则 攻略 中 ， 我 们 会 创建 简单 的 套 接 字 并 用 它们 进行 通信 。 
7.12.1 预备 知识 


要 实现 这 一 切 , 需要 创建 网 络 套 接 字 , 使 得 我 们 可 以 通过 TCP/IP 网 络 进行 数据 传输 。 最 简单 
的 方法 就 是 使 用 netcat 命 令 (或 nc )。 我们 需要 两 个 套 接 字 : 一 个 用 来 侦 听 ， 一 个 用 来 连接 。 


























7.12.2 ”实战 演练 
(1) 设置 侦 听 套 接 字 : 
nc - 1234 
这 会 在 本 地 主机 的 端口 1234 上 创建 一 个 侦 听 套 接 字 。 
(2) 连接 到 该 套 接 字 : 


nc HOST 1234 








如 果 是 在 运行 着 侦 听 套 接 字 的 主机 上 执行 该 命令 ， 那么 需要 将 HOST 更 换 成 
localhost， 或 将 其 更 换 成 其 他 主机 的 IP 地 址 或 主机 名 。 











(3) 要 想 发 送 消 息 ， 只 需要 在 执行 第 2 步 操作 的 主机 终端 中 输入 信息 并 按 回 车 键 就 行 了 。 
消息 会 出 现在 执行 第 1 步 操作 的 主机 终端 中 。 





7.12.3 ”补充 内 容 
网 络 套 接 字 可 不 仅 能 用 于 发 送 文 本 。 接 着 往 下 看 。 
在 网 络 上 进行 快速 文件 复制 
我 们 可 以 利用 netcat 和 shell 重 定向 来 简化 网 络 中 的 文件 复制 操作 。 
(1) 在 接收 端 执行 下 列 命令 : 
nc -1 1234 > destination filename 
(2) 在 发 送 端 执行 下 列 命令 : 


nc HOST 1234 < source filename 





7.13 互联 网 连接 共享 
在 如 今 的 计算 世界 里 ,我 们 平时 都 在 使 用 着 各 种 类 型 的 设备 。 桌面 计算 机 、 上 网 本 、 笔 记 本 








232 第 7 章 无 网 不 利 














电脑 、 平 板 电 脑 、 智 能 耳机 ， 等 等 。 我 们 需要 将 这 些 设备 都 连 人 互联 网 ， 这 通常 是 通过 无 线路 由 
器 实现 的 。 如 果 手 边 没 有 路 由 器 ( 或 者 路 由 器 坏 掉 了 ), 但 又 需要 共享 使 用 互联 网 , 该 怎么 办 呢 ? 
没 问 题 ! Linux 的 iptables 再 加 上 几 个 脚本 便 可 助 你 一 臂 之 力 。 











7.13.1 预备 知识 


在 这 则 攻略 中 , 我 们 使 用 iptables 设 置 网 络 地 址 转换 ( Network Address Translation ，NAT )， 
使 得 多 个 联网 设备 能 够 共享 互联 网 连接 。 你 需要 使 用 iwconfig 命 令 来 获得 无 线 接口 的 名 称 。 





7.13.2 ”实战 演练 


(1) 连接 到 互联 网 。 在 这 里 我 们 假设 使 用 的 是 有 线 网 络 连 接 ， 通 过 eth0 连 接 到 互联 网 。 
请 按照 你 个 人 的 实际 情况 进行 修改 。 


(2) 使 用 发 布 版 自 带 的 网 络 管理 工具 ， 创 建 一 个 adhoc 无 线 连接 ， 设 置 如 下 : 


口 IP 地 址 : 10.99.66.55 
口子 网 扼 码 : 255.255.0.0 ( 16 ) 


(3) 使 用 下 面 的 shell 脚 本 来 实现 互联 网 连接 共享 : 


#!/bin/bash 

#9 文件 名 : netsharing.sh 

echo 1 > /proc/sys/net/ipv4/ip _ forward 

iptables -A FORWARD -i $1 -o $2 -s 10.99.0.0/16 -m conntrack 

--ctstate NEW -j ACCEPT 

iptables -A FORWARD -m conntrack --ctstate ESTABLISHED,RELATED -j ACCEPT 
iptables -A POSTROUTING -t nat -j MASQUERADE 


(4) 执行 脚本 : 
./netsharing.sh eth0 wlan0 


其 中 ，eth0 是 连接 到 互联 网 的 接口 ，wlan0 是 用 于 共享 互联 网 连接 的 无 线 接口 。 
(5) 将 设备 连接 到 刚才 创建 的 无 线 网 络 : 


m IP 地 址 : 10.99.66.56( 以 此 类 推 )。 
ma 子 网 欣 码 : 255.255.0.0。 












































KW 要 想 更 为 便捷 ， 可 以 在 主机 上 安装 DHCP 和 DNS 服务 器 ， 这 样 就 不 必 手 动 配 
置 IP 地 址 了 。 你 可 以 使 用 一 个 叫做 dnsmasq 的 工具 来 进行 DHCP 和 DNS 操 作 。 


7.14 使 用 iptables 架设 简易 防火 墙 
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7.14 使 用 iptables 架设 简易 防火 墙 











防火 墙 是 一 种 网 络 服 务 , 它 可 以 用 来 过 滤 、 阻 塞 不 需要 的 网 络 流 量 , 允许 正常 的 网 络 流 
过 。Linux 中 最 为 强大 的 工具 非 iptables 莫 


[三 是 ] 


量 通 
时 ， 它 目前 已 经 被 集成 到 了 内 核 中 。 














7.14.1 ”实战 演练 





如 今 所 有 的 Linux 发 布 版 中 默认 都 包含 了 iptables。 我 们 接 下 来 会 看 到 一 些 典型 的 iptables 
的 配置 方法 。 


(1) 阻塞 发 送 到 特定 卫 地 址 的 流量 : 
#iptables -A OUTPUT -d 8.8.8.8 -j DROP 


如 果 在 执行 iptables 命 令 之 前 ， 从 另 一 个 终端 中 运行 PING 8.8.8.8， 你 会 看 到 如 
下 内 容 : 


PING 8.8.8.8 (8.8.8.8) 56(84) bytes of data. 
64 bytes from 8.8.8.8: 


64 bytes from 8.8.8.8: 


icmp_ req=1 ttl=56 time=221 ms 
ping: 


icmp_ req=2 ttl=56 time=221 ms 
sendmsg: Operation not permitted 
ping: sendmsg: Operation not permitted 

















ping 命 令 在 执行 到 第 三 次 的 时 候 失 败 了 , 这 是 因为 我 们 使 用 iptables 将 所 有 发 送 到 
8 .8.8.8 的 流量 给 丢弃 了 。 


(2) 阻塞 发 送 到 特定 端口 的 流量 : 


#iptables -A OUTPUT -p tcp -dport 21 -j DROP 
$ ftp ftp.kde.org 
ftp: connect: Connection timed out 


7.14.2 工作 原理 





iptables 是 Linux 系 统 中 用 来 假设 防火 墙 


问 











的 标准 命令 。iptables 中 的 第 一 个 选项 -A 表明 向 链 
( chain ) 中 添加 一 条 新 的 规则 ， 该 规则 由 后 续 参 数 给 出 。 链 就 是 一 组 规则 的 集合 ， 在 这 则 攻略 中 
我 们 使 用 的 是 ourPuT 链 ， 它 可 以 对 所 有 | 








1 站 ( outgoing ) 的 流量 进行 控制 o 
在 第 一 个 例子 中 , -a 指定 了 所 要 匹配 的 分 组 目的 地 址 。 随 后 使 用 -j 来 使 iptables 丢 弃 ( DROP ) 
符合 条 件 的 分 组 。 
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在 第 二 个 例子 中 ，-p 指 定 该 规则 是 适用 于 TCP， -dport 指 定 了 对 应 的 端口 。 这 样 我 们 就 可 以 


阻塞 所 有 出 站 的 FTP 流 量 了 。 


7.14.3 ”补充 内 容 
在 使 用 iptables 命 令 时 ， 你 可 能 希望 清除 对 iptables 链 所 做 出 的 所 有 改动 。 可 以 使 朋 





的 命令 : 


#iptables --flush 


下面 


第 8 章 


当 个 好 管 


对 








本 章 内 容 

口 统计 磁盘 使 用 情况 口 用 svslog 记 录 日 志 

口 计算 命令 的 执行 时 间 口 通过 监视 用 户 登 录 找 出 和 人 侵 者 

口 登录 用 户 、 启 动 日 志 及 启动 故障 的 相关 口 监视 远程 磁盘 的 健康 情况 
信息 口 找 出 系统 中 用 户 的 活动 时 段 

口 列 出 1 小 时 内 占用 CPU 最 多 的 10 个 进程 口 电源 使 用 的 测量 与 优化 

口 用 watch 监 视 命令 输出 口 监视 磁盘 活动 

口 记录 文件 及 目录 访问 口 检查 磁盘 及 文件 系统 错误 

口 用 logrotate 管 理 日 志文 件 





8.1 简介 

操作 系统 是 由 一 系列 不 同 用 途 的 系统 软件 组 成 的 。 为 了 了 解 这 些 软件 是 否 工作 正常 ,最 好 能 
够 对 其 进行 监视 。 我 们 可 以 使 用 一 项 被 称 为 日 志 记 录 (logging ) 的 技术 ,借助 这 项 技术 ,应 用 程 
序 在 运行 的 时 候 , 会 将 重要 的 信息 写 人 革 个 文件 中 。 该 文件 的 内 容 能 够 用 来 了 解 特定 程序 或 守护 
进程 的 操作 过 程 。 如 果 应 用 程序 或 服务 发 生 了 崩 演 ， 这 些 信息 有 助 于 我 们 进行 调试 和 故障 修复 。 


在 本 章 中 ,我 们 要 和 监视 系统 活动 的 各 种 命令 打交道 ,同时 还 要 学 习 日 志 技 术 及 其 使 用 方法 。 























8.2 监视 磁盘 使 用 情况 


磁盘 空间 是 一 种 有 限 资 源 。 我 们 经 常 要 统计 存储 介质 〈 例 如 硬盘 ) 的 使 用 情况 ， 以 便 确定 可 
用 空间 。 当 可 用 空间 开始 捉襟见肘 时 ,我 们 就 得 找到 大 体积 的 文件 ,删除 或 移 走 它们 ， 以 便 腾 出 
空间 。 除 此 之 外 ,磁盘 使 用 管理 也 用 于 shell 脚 本 环境 。 这 则 攻略 将 会 讲解 用 于 磁盘 管理 的 各 类 命 
令 及 其 选项 。 
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8.2.1 预备 知识 


df 和 du 是 Linux 中 用 于 统计 磁盘 使 用 情况 的 两 个 重要 命令 。df 是 disk free 的 缩写 ，du 是 disk 
usage 的 缩写 。 让 我 们 看 看 如 何 用 它们 执行 各 种 涉及 磁盘 使 用 情况 的 任务 。 

















8.2.2 ”实战 演练 
找 出 某 个 文件 〈 或 多 个 文件 ) 占用 的 磁盘 空间 : 
$ du FILENRME1 FILENAME2 .. 
例如 : 


$ du file.txt 


4 
| 统计 结果 默认 以 字 节 作为 计量 单位 。 | 


要 获得 某 个 目录 中 所 有 文件 的 磁盘 使 用 情况 ， 并 在 每 一 行 中 显示 各 个 文件 的 磁盘 占用 详情 
可 以 使 用 : 














$ du -a DIRECTORY 


-a 递归 地 输出 指定 目录 或 多 个 目录 中 所 有 文件 的 统计 结果 。 








执行 du DIRECTORY 也 可 以 输出 类 似 的 结果 ， 会 显示 子 目 录 使 用 的 
KS 磁盘 空间 ， 而 不 显示 每 个 文件 占用 空间 的 情况 。 es 示 文 件 的 碳 盘 使 用 情况 ， 
必须 使 用 -do 


$ du -a test 

4 test/output.txt 

4 test/process log.sh 
4 test/pcpu.sh 

1 





使 用 du DIRECTORY 的 输出 如 下 : 
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8.2.3 补充 内 容 

让 我 们 看 看 du 命令 的 其 他 用 法 。 

1. 以 KB、MB 或 块 〈block) 为 单位 显示 磁盘 使 用 情况 

命令 gu 默认 显示 文件 占用 的 总 字 节 数 , 但 是 以 标准 单位 KB、MB 或 GB 显示 磁盘 使 用 情况 更 
方便 人 们 阅读 。 要 采用 这 种 更 友好 的 格式 进行 打印 ， 可 以 使 用 选项 -h: 

du -h FILENAME 
例如 : 


$ du -h test/pcpu.sh 
4.0K test/pcpu.sh 
# 可 以 接受 多 个 文件 参数 


或 者 


# du -h DIRECTORY 
$ du -h hack/ 
16K hack/ 


2. 显示 磁盘 使 用 总 计 

假如 我 们 需要 计算 所 有 文件 或 目录 总 共 占 用 了 多 少 磁 盘 空间 , 那么 显示 单个 文件 的 使 用 情况 
显然 没什么 用 。au 的 选项 -c 可 以 输出 作为 命令 参数 的 所 有 文件 和 目录 的 磁盘 使 用 情况 ， 它 会 在 
输出 结果 末尾 加 上 一 行 总 计 。 语 法 如 下 : 


$ du -c FILENAME1 FILENAME2.. 


例如 : 





du -c process_ log.shpcpu.sh 
4 process log.sh 

4 pcpu.sh 

8 total 


或 者 
$ du -c DIRECTORY 
例如 : 
$ du -c test/ 


16 test/ 
16 total 


或 者 
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$ du -c *.txt 

# 通配符 

-c 可 以 同 -a、-h 等 选项 组 合 使 用 。 如 果 不 使 用 -c， 也 可 以 得 到 同样 的 输出 。 唯 一 不 同 的 是 
选项 -c 会 添加 一 行 磁盘 使 用 情况 总 计 。 

另 一 个 选项 -s( summarize， 合计 ) 则 只 输出 合计 数据 。 它 可 以 配合 -h 打 印 出 人 们 易 读 的 
格式 。 这 个 命令 在 实践 中 经 常 使 用 ， 其 语法 如 下 : 


$ du -s FILES(s) 
$ du -sh DIRECTORY 


例如 : 


$ du -sh slynux 
680K slynux 


3. 用 特定 的 单位 打印 文件 
我 们 可 以 强制 au 使 用 特定 的 单位 打印 磁盘 使 用 情况 。 举 例如 下 。 
D 打印 以 字 节 (默认 输出 ) 为 单位 的 文件 大 小 : 
$ du -b FILE(s) 
口 打印 以 KB 为 单位 的 文件 大 小 : 
$ du -k FILE(s) 
口 打印 以 MB 为 单位 的 文件 大 小 : 
$ du -m FILE(s) 
口 打印 以 指定 块 为 单位 的 文件 大 小 : 
$ du -B BLOCK SIZE FILE(s) 
其 中 BLOCK_STZE 以 字 节 为 单位 。 


下 面 的 例子 中 包含 了 这 些 命令 : 


























$ du pcpu.sh 

4 pcpu.sh 

$ du -b pcpu.sh 
439 pcpu.sh 

$ du -k pcpu.sh 

4 pcpu.sh 

$ du -m pcpu.sh 

1 pcpu.sh 

$ du -B 4 pcpu.sh 
1024 pcpu.sh 
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4. 从 磁盘 使 用 统计 中 排除 部 分 文件 

有 时 候 我 们 需要 从 磁盘 使 用 统计 中 排除 部 分 文件 。 可 以 使 用 两 种 方法 指定 需要 排除 的 文件 : 
(1) 通配符 

按照 下 面 的 方法 指定 一 个 通配符 : 




















$ du --exclude "WILDCARD" DIRECTORY 
例如 : 


$ du --exclude "*.txt" FILES(s) 


# 排除 所 有 的 -txt 文件 
(2) 排除 列表 


从 文件 中 获取 需要 排除 的 文件 列表 : 


$ du --exclude-from EXCLUDE.txt DIRECTORY 

# EXCLUDE .txt 包含 了 需要 排除 的 文件 列表 

还 有 其 他 的 选项 可 以 很 方便 地 用 来 限制 磁盘 使 用 情况 统计 的 范围 。 我 们 可 以 用 
--max-depth 指 定 du 应 该 遍历 的 目录 层次 的 最 大 深度 。 将 深度 指定 为 1， 可 以 统计 当前 目录 下 的 
所 有 文件 占用 内 存 的 情况 。 将 深度 指定 为 2， 可 以 统计 当前 目录 以 及 下 一 级 子 目录 中 文件 占用 内 
存 的 情况 ， 但 不 包括 第 二 级 子 目 录 。 


例如 : 

















$ du --max-depth 2 DIRECTORY 


当 使 用 au 时 ， 要 确保 对 其 遍历 的 目录 和 文件 拥有 适合 的 读 权限 。 


可 以 用 选项 -x 来 限制 du， 使 它 只 能 够 对 单个 文件 系统 进行 遍历 。 假 设 运行 

du DIRECTORY， 它 会 递归 地 遍历 每 一 个 可 能 存在 的 子 目 录 。 目 录 层 次 中 的 某 个 

子 目 录 可 能 就 是 一 个 挂 载 点 (例如 ，/mnt/sdal 是 /mnt 的 子 目录 ， 同 时 也 是 设 

~ 备 /dev/sdal 的 挂 载 点 )。dqu 会 遍历 挂 载 点 并 统计 设备 文件 系统 的 磁盘 使 用 情 

况 。 为 了 避免 du 的 这 种 行为 ， 可 以 在 使 用 du 其 他 选项 的 同时 加 上 选项 -x。du -x/ 
会 将 /mnt/ 中 的 所 有 挂 载 点 排除 在 磁盘 使 用 统计 之 外 。 


5. 找 出 指定 目录 中 最 大 的 10 个 文件 


我 们 经 常会 磁 上 找 出 大 体积 文件 的 活 儿 ， 一 般 是 要 将 这 些 大 文件 删除 或 移 走 。 可 以 用 au 和 
sort 轻 松 地 完成 这 项 任务 : 
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其 中 


$ du -ak SOURCE DIR | sort -nrk 1 | head 


，-a 使 得 Qu 遍历 SOURCE_DIR 并 计算 其 中 所 有 文件 的 大 小 。 由 于 指定 了 选项 -k， 输 出 的 第 一 











列 会 包含 以 KB 为 单位 的 文件 大 小 ， 第 二 列 则 会 包含 文件 或 文件 夹 的 名 称 。 


上 面 这 个 单行 脚本 的 缺点 在 于 它 在 结果 中 包含 了 目录 。 如 果 我 们 只 是 需要 找 出 最 大 的 文件 而 不 是 


sort 对 第 一 列 依 数值 逆序 排序 。head 用 来 显示 前 10 行 输出 。 例 如 : 


$ du -ak /home/slynux | sort -nrk 1 | head -n 4 
50220 /home/slynux 

43296 /home/slynux/ .mozilla 

43284 /home/slynux/ .mozilla/firefox 

43276 /home/slynux/ .mozilla/firefox/8c22khxc.default 











目录 ， 可 以 按照 下 面 的 方法 改进 脚本 ， 使 它 只 输出 最 大 的 文件 : 


$ find . -type f -exec du -k {} \; | sort -nrk 1 | head 


利用 finq 替 au 将 文件 过 滤 出 来 ， 而 无 需 使 用 au 进行 递归 遍历 。 








6. 磁盘 可 用 空间 信息 
au 提供 磁盘 使 用 情况 信息 ， 而 af 提供 磁盘 可 用 空间 信息 。aqf 的 -h 选 项 会 以 易 读 的 格式 打印 

















磁盘 空间 信息 。 例 如 : 


8.3 


$ df -h 

Filesystem Size Used Avail Use% Mounted on 

/dev/sdal 9.2G 2.2G 6.6G 25% / 

none 497M 240K 497M 1% /dev 

none 502M 168K 501M 1% /dev/shm 

none 502M 88K 501M 1% /var/run 

Done 502M 0 502M 0% /var/lock 

Done 502M 0 502M 0% /lib/init/rw 

none 9.2G 2.2G 6.6G 25% /var/lib/ureadahead/debugfs 


计算 命令 执行 时 间 
当 测 试 一 个 应 用 程序 的 效率 或 比较 不 同 的 算法 时 ,其 执行 时 间 非 常 重要 。 好 算法 的 执行 时 间 














应 该 很 得 。 让 我 们 看 看 如 何 来 计算 执行 时 间 。 


8.3. 





1 实战 演练 
(1) 要 测试 执行 时 间 ， 只 需要 将 time 放 在 想 要 运行 的 命令 之 前 。 例 如 : 


$ time COMMAND 
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命令 coMMAND 会 执行 并 生成 输出 。 除 此 之 外 ，time 命 令 会 将 命令 的 执行 时 间 添 加 到 
stderr 中 。 例 如 : 





$ time 1s 
test .txt 
next .txt 
real om0 .008s 
user om0 .001s 
SYS 0m0 .003s 


输出 中 分 别 显 示 了 执行 该 命令 所 花费 的 real 时 间 、user 时 间 以 及 sys 时 间 。 





time 命 令 的 可 执行 二 进 制 文 件 位 于 /usr/bin/time ， 还 有 一 个 
shell 内 建 命令 也 叫做 time。 当 运行 Lime 时 ， 默 认 调 用 的 是 shell 的 
内 建 命令 。shell 内 建 的 time 命 令 选 项 有 限 。 因 此 ， 如 果 我 们 需要 
使 用 另外 的 功能 ， 就 应 该 使 用 可 执行 文件 time 的 绝对 路 径 
( /usr/bin/time )。 


(2) 可 以 用 选项 -o filename 将 相关 的 时 间 统 计 信 息 写 入 文件 : 
$ /usr/bin/time -o output .txt COMMAND 
文件 名 应 该 出 现在 选项 -o 之 后 。 
要 将 命令 执行 时 间 添 加 到 文件 而 不 影响 其 原 有 内 容 ， 使 用 选项 -a 以 及 -o: 
$ /usr/bin/time -a -o output .txt COMMAND 


(3) 我 们 也 可 以 使 用 选项 -£， 利 用 格式 字符 串 来 格式 化 时 间 输 出 。 格 式 字符 串 由 对 应 于 
寺 定 选项 的 参数 组 成 ， 这 些 参 数 以 % 作为 前 级 。real 时 间 、user 时 间 、sys 时 
间 的 格式 字符 串 分 别 如 下 : 





D real: $e 
D user: %$U 
口 sys: SS 


通过 结合 参数 字符 串 ， 我 们 就 可 以 创建 格式 化 输出 : 








$ /usr/bin/time -上 "FORMAT STRING" COMMAND 
例如 : 


$ /usr/bin/time -f "Time: %U" -a -o timing.log uname 
Linux 





其 中 ，g%U 是 user 时 间 的 参数 。 


格式 化 输出 生成 后 被 写 人 标准 和 输出， 命令 的 执行 时 间 信 息 被 写 人 标准 错误 。 我 们 可 
以 用 重 定向 操作 符 〈> ) 对 格式 化 输出 重 定 向 ,用 错误 重 定向 操作 符 ( 2> ) 对 时 间 信 
息 重 定向 。 


例如 : 





$ /usr/bin/time -E "Time: %U" uname> command output .txt 2>t 上 ime .1Log 
$ cat 七 ime .Log 

Time: 0.00 

$ cat command output .txt 

Linux 


(4) 使 用 参数 sz 显示 系统 页 面 大 小 : 





$ /usr/bin/time -f "Page size: %Z bytes" ls> /dev/null 
Page size: 4096 bytes 


这 里 并 不 需要 被 计时 命令 的 输出 ( 即 1s ), 因此 为 了 使 其 不 显示 在 终端 中 ,我们 将 标 
准 输 出 重 定向 到 了 /dev/null 设 备 。 


还 有 很 多 可 用 格式 字符 串 ， 请 阅读 man time 以 获取 更 多 的 细节 信息 。 





8.3.2 工作 原理 
有 以 下 三 种 不 同类 型 的 时 间 。 


口 Real 时 间 指 的 是 挂钟 时 间 (wall clocktime )， 也 就 是 命令 从 开始 执行 到 结束 的 时 间 。 这 段 
时 间 包 括 其 他 进程 所 占用 的 时 间 片 (time slice ) 以 及 进程 被 阻塞 时 所 花费 的 时 间 ( 例如， 
为 等 待 JO 操 作 完 成 所 用 的 时 间 )。 

口 User 时 间 是 指 进程 花费 在 用 户 模式 〈 内 核 之 外 ) 中 的 CPU 时 间 。 这 是 唯一 真正 用 于 执行 

进程 所 花费 的 时 间 。 执 行 其 他 进程 以 及 花费 在 阻塞 状态 中 的 时 间 并 没有 计算 在 内 。 

口 Sys 时 间 是 指 进程 花费 在 内 核 中 的 CPU 时 间 。 它 代表 在 内 核 中 执行 系统 调用 所 使 用 的 时 
间 ， 这 和 库 代 码 (library code ) 不 同 ， 后 者 仍旧 运行 在 用 户 空间 。 与 “user 时 间 ” 类 似 ， 
这 也 是 真正 由 进程 使 用 的 CPU 时 间 。 


通过 time 命 令 可 以 获得 进程 的 很 多 细节 信息 ， 包 括 退 出 状态 、 接 收 到 的 信号 数量 、 进 程 上 
下 文 的 切换 次 数 等 。 每 一 个 参数 都 可 以 用 适合 的 格式 字符 串 显 示 。 


表 8-1 展 示 了 一 些 可 以 使 用 的 参数 。 
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表 8-1 


描述 


中 











$C 进行 计时 的 命令 名 称 以 及 命令 行 参数 

%D 进程 非 共享 数据 区 域 的 大 小 ， 以 KB 为 单位 

SE 进程 使 用 的 real 时 间 ( 挂钟 时 间 ) ， 显 示 格 式 为 [小 时 :] 分 钟 : 秒 

%X 命令 的 退出 状态 

Sk 进程 接收 到 的 信号 数量 

SW 进程 被 交换 出 主 存 的 次 数 

%2 系统 的 页 面 大 小 。 这 是 一 个 系统 常量 ， 但 在 不 同 的 系统 中 ， 这 个 常量 值 也 不 同 
$P 进程 所 获得 的 CPU 时 间 百 分 比 。 这 个 值 等 于 usertsystem 时 间 除 以 总 运行 时 间 。 结 果 以 百分比 形式 显示 
SK 进程 的 平均 总 ( datatstackttext ) 内 存 使 用 量 ， 以 KB 为 单位 

Sw 进程 主动 进行 上 下 文 切换 的 次 数 ， 例 如 等 待 WO 操 作 完 成 

Sc 进程 被 迫 进行 上 下 文 切换 的 次 数 ( 由 于 时 间 片 到 期 ) 
























































































































































五 
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收集 与 操作 环境 、 当 前 登录 用 户 、 主 机 加 电 时 间 、 启 动 故 障 等 相关 的 信息 很 有 用 处。 在 这 则 
攻略 会 讲解 一 些 用 于 收集 活动 主机 信息 的 相关 命令 。 


8.4.1 预备 知识 


接 下 来 将 介绍 以 下 命令 : who 、w、users、uptime、1last 和 1lastb。 


8.4.2 实战 演练 
(1) 获取 当前 登录 用 户 的 相关 信息 : 





$ who 
slynux pts/0 2010-09-29 05:24 (slynuxs-macbook-pro.local) 
slynux tty7 2010-09-29 07:08 (:0) 


该 命令 会 显示 出 登录 名 、 用 户 所 使 用 的 TTY、 登 录 时 间 以 及 登录 用 户 的 远程 主机 名 
(或 者 X 显 示 信 息 )。 





TTY ( 该 术语 取 自 TeleTYperwriter ) 是 与 文本 终端 相关 联 的 设备 

eC 文件 。 当 用 户 生 成 一 个 新 终端 时 ， 对 应 的 设备 文件 就 会 出 现在 /dev/ 

~> 中 (例如 /dev/pts/3 )。 可 以 通过 输入 并 执行 命令 tty 来 获得 当前 终端 
的 设备 路 径 。 
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(2) 获得 有 关 登 录用 户 更 详细 的 信息 : 


$ w 

07:09:05 up 1:45， 2 users, load average: 0.12, 0.06, 0.02 
USER TY FROM LOGINE@ IDLE JCPU PCPU WHAT 

slynux pts/0 slynuxs 05:24 0.00s 0.65s 0.11s sshd: slynux 
slynux tty7 :0 07:08 1:45m 3.28s 0.26s gnome-session 








第 一 行列 出 了 当前 时 间 ， 系 统 运行 时 间 ， 当 前 登录 的 用 户 数 量 以 及 过 去 的 1 分 钟 、5 
J 15 分 钟 内 的 系统 平均 负载 。 接 下 来 的 每 一 行 显示 了 每 一 个 登录 用 户 的 详细 信 
息 ， 其 中 包括 登录 名 、TTY、 远 程 主机 、 登 录 时 间 、 空 闲 时 间 、 自 该 用 户 登录 后 所 
使 用 的 总 CPU 时 间 、 当 前 运行 进程 所 使 用 的 CPU 时 间 以 及 进程 所 对 应 的 命令 行 。 

















KA uptime 命 令 输 出 中 的 平均 负载 Uo vege eR 载 
量 的 一 个 参数 。 在 第 9 章 我 们 会 对 此 进行 详细 地 解释 。 


(3) 列 出 当前 登录 主机 的 用 户 列表 : 


$ users 
slynux slynux slynux hacker 


如 果 某 个 用 户 打开 了 多 个 伪 终 端 ， 那 么 该 用 户 会 被 多 次 显示 。 在 上 面 的 输出 中 ， 用 
户 slynux 打 开 了 3 个 伪 终 端 ,排除 重复 用 户 出 现 的 最 简单 的 方法 是 使 用 sort 和 unia 
进行 过 滤 : 


$ users | tr' ' '\n' | sort | unig 











slynux 
hacker 


利用 tr 将 ' ' 替 换 成 '\n' ,然后 用 sort 和 unig 为 每 个 用 户 生 成 唯一 的 输出 。 
(4) 查看 系统 已 经 加 电 运 行 了 多 长 时 间 : 


$ uptime 
21:44:33 up 3:17, 8 users, load average: 0.09, 0.14, 0.09 


单词 up 之 后 的 时 间 表 明了 系统 已 经 加 电 运 行 了 多 久 。 我 们 可 以 编写 一 个 简单 的 单行 
脚本 来 提取 运行 时 间 : 


$ uptime | grep -Po '\d{2}\:\d{2}\:\d{2}' 
这 条 命令 利用 grep 和 per1 风 格 的 正则 表达 式 来 提取 由 冒号 分 隔 的 3 组 两 位 数字 。 
(5) 获取 上 一 次 启动 以 及 用 户 登 录 会 话 的 信息 : 


$ last 
slynux tty7 :0 Tue Sep 28 18:27 still logged in 
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reboot system boot 2.6.32-21-generic Tue Sep 28 18:10 - 21:46 (03:35) 
slynux pts/0 :0.0 Tue Sep 28 05:31 - crash (12:39) 


last 命 令 可 以 提供 登录 会 话 信息 。 它 实际 上 是 一 个 系统 登录 日 志 , 包括 了 登录 tty、 
登录 时 间 、 状 态 等 信息 。 


last 命 令 以 日 志文 件 /var/log/wtmp 作 为 输入 日 志 数 据 。 它 也 可 以 用 选项 -f 明 确 地 指 
定 日 志文 件 。 例 如 : 











$ last -E /var/log/wtmp 
(6) 获取 单个 用 户 登 录 会 话 的 信息 : 
$ last USER 


(7) 获取 重启 会 话 (reboot session ) 信息 : 





$ last reboot 
reboot system boot 2.6.32-21-generi Tue Sep 28 18:10 - 21:48 (03:37) 
reboot system boot 2.6.32-21-generi Tue Sep 28 05:14 - 21:48 (16:33) 


(8) 获取 失败 的 用 户 登 录 会 话 信 息 : 








# lastb 
test tty8 :0 Wed Dec 15 03:56 - 03:56 (00:00) 
slynux tty8 :0 Wed Dec 15 03:55 - 03:55 (00:00) 





你 必须 以 root 用 户 的 身份 运行 1astb。 


8.5 列 出 1 小 时 内 占用 CPU 最 多 的 10 个 进程 


CPU 是 一 种 重要 的 资源 , 最 好 能 够 跟踪 蘑 个 阶段 内 占用 CPU 最 多 的 进程 。 通 过 监视 一 段 时 间 
内 CPU 的 使 用 情况 ， 我 们 可 以 找 出 长 期 占用 CPU 的 进程 并 对 其 进行 优化 ， 提 高 CPU 使 用 效率 。 我 
们 在 这 则 攻略 中 讨论 了 进程 监视 与 日 志 记 录 。 





8.5.1 预备 知识 


ps 命令 用 于 收集 系统 中 进程 的 详细 信息 。 这 些 信息 包括 CPU 使 用 情况 、 正 在 执行 的 命令 、 内 
存 占用 、 进 程 状态 等 。 记 录 在 一 小 时 内 的 CPU 占用 情况 ,然后 灵活 地 运用 ps 以 及 文本 处 理 就 可 以 
找 出 占用 CPU 最 多 的 10 个 进程 。 关 于 ps 命令 的 更 多 细节 ， 请 参考 第 9 章 。 











8.5.2 ”实战 演练 
让 我 们 看 看 用 于 监视 并 计算 一 小 时 内 CPU 使 用 情况 的 shell 脚 本 : 
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#!/bin/bash 
# 文 件 名 : pcpu_usage.sh 
# 用 途 : 计算 1 个 小 时 内 进程 的 CPU 占用 情况 


SECS=3600 
UNIT TIME=60 


# 将 SECS 更 改 成 需要 进行 监视 的 总 秒 数 
#UNIT_TIME 是 取样 的 时 间 间 隔 ， 单 位 是 秒 


STEPS=$(( $SECS / $UNIT TIME ) ) 
echo Watching CPU usage... } 


for((i=0;i<STEPS;i++)) 

do 
ps -eocomm,pcpu | tail -n +2 >> /tmp/cpu usage.$$ 
sleep S$UNIT TIME 

done 


echo 
echo CPU eaters : 


cat /tmp/cpu usage.$$ | \ 
awk ' 
{ process[$1]+=$2; } 
ENDT{ 
for(i in process) 
{ 
printf("%-20s %s\n",i, process[i]) ; 


}' | sort -nrk 2 | head 


rm /tmp/cpu usage.$s 
# 删 除 临 时 日 志文 件 


输出 如 下 : 


$ ./pcpu usage.sh 
Watching CPU usage... 
CPU eaters : 


Xorg 20 
firefox-bin 15 
bash 3 
evince 2 
pulseaudio 1.0 
pcpu.sh 0.3 


wpa_ supplicant 0 
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wnck-applet 0 
watchdog/0 0 
usb-storage 0 


8.5.3 工作 原理 


在 上 面 的 脚本 中 , 主要 的 输入 源 是 ps -eo comm,pcpu, 其 中 comm 表 示 命 令 名 ( command name )， 
pcpu 表 示 CPU 使 用 率 (CUP usage in percent )。 该 命令 输出 所 有 进程 名 及 CPU 使 用 率 。 每 个 进程 
对 应 一 行 输出 。 因 为 需要 监视 一 小 时 内 CPU 的 使 用 情况 ， 所 以 我 们 得 在 一 个 每 次 迭代 时 间 为 60 
秒 的 for 循 环 中 不 停 地 用 ps -eo comm,pcpu | tail -n +2 来 获取 CPU 的 使 用 统计 数据 ， 并 
将 这 些 数据 添加 到 文件 /tmp/cpu_usage .$s 中 。60 秒 的 迭代 时 间 通 过 sleep 60 来 提供 。 这 就 
使 得 每 分 钟 执行 一 次 bs。tail -n +2 用 来 将 ps 输出 中 的 头 部 和 coMMAND gscPU 和 剥 除 。 

cpu_usage.$$ 中 的 $$ 表示 当前 脚本 的 进程 ID。 假设 进程 ID 为 1345， 那 么 在 脚本 执行 时 
它 会 被 替换 成 /tmp/cpu_usage.1345。 因 为 这 是 一 个 临时 文件 ， 所 以 我 们 把 它 放 在 /tmp 中 。 

统计 文件 在 1 小 时 后 就 准备 妥当 了 ， 文 件 中 包含 了 60 项 ， 分 别 对 应 每 分 钟 的 进程 状态 。 然 后 
用 awk 求 出 每 个 进程 总 的 CPU 使 用 情况 。 我 们 用 了 一 个 关联 数组 来 统计 CPU 使 用 情况 。 其 中 进程 
名 作为 数组 索引 。 最 后 根据 总 的 CPU 使 用 情况 依 数值 逆序 排序 ， 并 通过 heagd 获 得 前 10 项 。 






































8.5.4 ”参考 


口 4.6 节 讲解 了 awk 命令 。 
口 3.13 节 讲解 了 tail 命 令 。 





8.6 使 用 watch 监视 命令 输出 


我 们 可 能 需要 在 一 段 时 期 内 以 固定 的 间隔 时 间 不 断 监视 某 个 命令 的 输出 。 例 如 在 复制 大 文件 
时 , 我 们 希望 看 到 不 断 增 长 的 文件 大 小 。 要 做 到 这 一 点 , 我 们 可 以 使 用 watch 命 令 来 执行 du 命令 ， 
不 断 地 重复 输出 。 这 则 攻略 会 告诉 你 实现 方法 。 








8.6.1 实战 演练 


watch 命 令 可 以 用 来 在 终端 中 以 固定 的 间隔 监视 命令 输出 。 该 命令 语法 如 下 : 





$ watch COMMAND 
例如 : 


$ watch 1s 





$ watch 'COMMRANDS 
例如 : 


$ watch '!1Ss -1 | grep "^d"' 
# 只 列 出 目录 


命令 默认 每 2 秒 更 新 一 次 输出 。 


我 们 可 以 用 -n _ SECOND 指定 更 新 输出 的 时 间 间 陋 。 例 如 : 








$ watch -n 5 '!1Ss -1' 
# 以 5 秒 为 间隔 ， 监 视 1s -1 的 输出 


8.6.2 补充 内 容 
让 我 们 再 来 看 一 下 watch 命 令 的 其 他 特性 。 
突出 标示 watch 输 出 中 的 差异 


watch 有 一 个 选项 可 以 将 时 间 间 隔 前 后 的 命令 输出 的 差异 之 处 以 不 同 颜 色 突 出 标示 出 来 。 选 
项 -d 可 以 启用 这 一 功能 : 


$ watch -d 'COMMANDS' 


8.7 ”记录 文件 及 目录 访问 

记录 文件 及 目录 访问 对 于 跟踪 文件 和 目录 的 变化 很 有 帮助 。 这 则 攻略 会 讲解 如 何 记录 这 种 类 
型 的 访问 。 
8.7.1 预备 知识 


inotifywait 命 令 可 以 用 来 收集 有 关 文件 访问 的 信息 。Linux 发 布 版 默认 并 没有 包含 这 个 命 
令 ， 你 得 用 软件 包 管理 器 自行 安装 inotify-tools。 这 个 命令 还 需要 将 inotify 支 持 编译 入 Linux 内 


核 ， 好 在 大 多 数 新 的 GNU/Linux 发 布 版 已 经 都 在 内 核 中 启用 了 inotify。 





























8.7.2 ”实战 演练 
来 看 看 用 来 监视 目录 访问 的 shell 脚 本 : 


#/bin/bash 
# 文 件 名 : watchdir.sh 
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# 用 途 : 监 视 目录 访问 
path=$1 
# 将 目录 或 文件 路 径 作 为 脚本 参数 


inotifywait -m -r -e create,move,delete $path -qa 
输出 样 例如 下 : 


$ ./watchdir.sh . 
CREATE new 
MOVED FROM new 
MOVED_ TO news 


/ 
。/ 
。/ 

/ DELETE news 


8.7.3 工作 原理 


上 面 的 脚本 记录 给 定 了 路 径 中 文件 或 目录 的 创建 、 移 动 以 及 删除 。 选 项 -m 表 明 要 持续 监视 
变化 ， 而 不 是 在 事件 发 生 之 后 退出 。-r 人 允许 采用 递归 形式 监视 目录 (忽略 符号 链接 )。-e 指定 
需要 监视 的 事件 列表 。-q 用 于 减少 元 余 信息 ， 只 打印 出 所 需要 的 信息 。 命 令 输出 可 以 被 重 定向 
到 日 志文 件 。 


我 们 可 以 从 事件 列表 中 添加 或 删除 事件 。 一 些 重要 的 事件 如 表 8-2 所 示 。 









































表 8-2 

事 件 描 述 
访问 (access ) 读 取 文件 
修改 (modify ) 文件 内 容 被 修改 
属性 (attrib) 文件 元 数据 被 修改 
移动 (move ) 移动 文件 操作 
创建 (create ) 生成 新 文件 
打开 ( open ) 打开 文件 操作 
关闭 (close ) 关闭 文件 操作 
删除 (aelete ) 文件 被 删除 











8.8 用 logrotate 管理 日 志文 件 


日 志文 件 是 Linux 系 统 维护 中 必 不 可 少 的 组 成 部 分 ， 它 可 以 帮助 跟踪 系统 内 各 种 服务 中 出 现 
的 事件 。 这 既 有 助 于 排查 问题 ， 也 可 以 为 活动 主机 提供 统计 数据 。 随 着 时 间 的 推移 ， 日 志文 件 会 
变 得 越 来 越 大 ,因而 对 于 日 志文 件 的 管理 就 必 不 可 少 了 。 我 们 将 用 一 种 被 称 为 轮 替 (rotation ) 的 
技术 来 限制 日 志文 件 的 体积 ， 一 旦 它 超过 了 限定 的 大 小 ， 就 对 其 内 容 进行 抽取 ( strip )， 同 时 将 
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志文 件 中 的 旧 条 目 存储 到 日 志 目 录 中 的 归档 文件 内 。 旧 的 日 志文 件 就 会 得 以 保存 以 便 随 后 参 
后 。 让 我 们 看 看 如 何 对 日 志文 件 进 行 轮 蔡 及 存储 。 


8.8.1 预备 知识 


logrotate 是 每 一 位 Linux 系 统管 理 员 都 应 该 了 解 的 命令 。 它 能 够 将 日 志文 件 的 大 小 限制 在 

定 的 SIZE 内 。 日 志 记 录 程序 会 将 信息 添加 到 日 志文 件 中 。 9 总 是 出 现在 日 志文 
We logrotate 根 据 配 置 文件 扫描 特定 的 日 志文 件 。 它 在 保留 日 志文 件 中 最 新 添加 的 
100KB 内 容 (假设 指 i a 
logfile name.1。 随 着 该 日 志文 件 ( logfile name.1 ) 中 的 内 容 越 来 越 多 ， 逐渐 超出 了 sIzE 规 定 的 
定额 ，logrotate 就 会 再 用 最 近 的 内 容 更 新 日 志文 件 ， 然 后 用 较 旧 的 内 容 创 建 logfile_name.2。 
整个 过 程 可 以 轻松 地 使 用 1ogrotate 进 行 配置 。1logrotate 还 可 以 将 旧 的 日 志文 件 压 缩 成 
logfile name.1. gz 、logfile_name.2.gz 等 。 是 否 选 择 压 缩 旧 日 志文 件 也 可 以 通过 logrotate 来 
配置 。 


















































8.8.2 ”实战 演练 


logrotate 的 配置 目录 位 于 /etc/logrotate.d。 如 果 列 出 这 个 目录 中 的 内 容 , 你 会 发 现 很 多 其 他 
的 日 志文 件 配 置 。 








我 们 可 以 为 自己 的 日 志文 件 ( 比如 /var/log/program.log ) 编写 一 个 特定 的 配置 : 


$ cat /etc/logrotate.d/program 
/var/log/program.log { 
missingok 
notifempty 
size 30k 
compress 
weekly 
rotate 5 
create 0600 root root 


: 


这 就 是 全 部 的 内 容 。 其 中 ，/varlog/program.log 指 定 了 日 志文 件 路 径 。 旧 的 日 志文 件 归 档 之 
后 也 放 入 同一 个 目录 中 。 








8.8.3 工作 原理 
表 8.3 列 出 了 配置 文件 中 各 个 参数 的 含义 。 
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表 8-3 
参 数 描述 
missingok 如 果 日 志文 件 丢 失 ， 则 忽略 ; 然后 返回 ( 不 对 日 志文 件 进 行 轮 苦 ) 
notifempty 仅 当 源 日 志文 件 非 空 时 才 对 其 进行 轮 蔡 
size 30k 限制 实施 轮 替 的 日 志文 件 的 大 小 。 可 以 用 1M 表 示 1MB 
compress 允许 用 gzip 压 缩 较 旧 的 日 志 
weekly 指定 进行 轮 替 的 时 间 间 隔 。 可 以 是 weekly、yeazrly 或 aaily 














rotate 5 





这 是 需要 保留 的 旧 日 志文 件 的 归档 数量 。 在 这 里 指定 的 是 5， 所 以 这 些 文件 名 将 会 
program.log.1.gz、program.log.2.gz 等 直到 program.log.5.gz 


create 0600 root root 站 定 所 要 创建 的 归档 文件 的 模式 、 用 户 以 及 用 户 组 















































表 8-3 中 的 选项 都 是 可 选 的 。 我们 只 在 logrotat 配 置 文件 中 指定 所 需 的 选项 即 可 。 如 果 想 了 
解 更 多 的 可 用 选项 ， 请 参考 logrotate 的 手册 页 ( http://linux.die.net/man/8/logrotate )。 


8.9 用 syslog 记录 日 志 


通常 与 各 种 守护 进程 和 应 用 程序 相关 的 日 志文 件 都 会 放 在 /var/log 目 录 中 ,因为 这 是 存储 日 志 
文件 的 公共 目录 。 如 果 你 读 过 日 志文 件 ， 就 会 看 a mid 在 Linux 系 统 
中 ， ei /varlog 中 创建 并 写 人 日 志 信 息 。 每 一 个 标准 应 
用 进程 都 可 以 利用 syslog 记 录 日 志 人 信息。 在 这 则 攻略 中 ， 我 们 将 讨 人 如 何在 脚本 中 用 sysloga 
进行 日 志 信 息 的 记录 。 
































8.9.1 预备 知识 


日 志文 件 有 助 于 我 们 推断 系统 出 现 了 什么 故障 。 在 编写 重要 的 应 用 程序 时 , 应 当 将 应 用 程序 
的 执行 过 程 记 录 在 日 志文 件 中 。 我 们 接 下 来 将 学 习 使 用 命令 logger 通 过 syslogd 记 录 日 志 。 在 
学 习 如 何 往 日 志文 件 中 写 入 信息 之 前 ， 先 看 看 Linux 中 一 些 重 要 的 日 志文 件 ， 如 表 8-4 所 示 。 



















































































表 8-4 

日 志文 件 描 述 
/var/log/boot.1log 系统 启动 信息 
/var/log/httpd Apache Web 服 务 器 日 志 
/var/log/messages 发 布 内 核 家 动 信 息 
/var/log/auth.1log 用 户 认 证 日 志 
/var/log/dmesg 系统 启动 信息 
/var/log/mail.1log Bp 件 服务 器 日 志 
/var/log/Xorg.0.1og XX 服务 器 日 志 
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8.9.2 ”实战 演练 
下 面 来 看 看 如 何 使 用 logger 创 建 及 管理 日 志 信息 。 
(1) 向 系统 日 志文 件 /var/log/message 中 写 入 日 志 信 息 : 





$ logger LOG MESSAGE 
例如 : 


$ logger This is a test log line 


$ tail -n 1 /var/log/messages 

Sep 29 07:47:44 slynux-laptop slynux: This is a test log line 
/Var/log/messages 是 一 个 通用 日 志文 件 。 如 果 使 用 logger 命 令 , 它 默 认 将 日 志 信息 记 
录 到 /var/log/messages 中 。 


(2) 如 果 要 记录 特定 的 标记 (tag )， 可 以 使 用 : 





























$ logger -七 TAG This is a message 


$ tail -n 1 /var/log/messages 
Sep 29 07:48:42 slynux-laptop TAG: This is a message 


Syslog 处 理 /var/log 下 的 多 个 日 志文 件 。 但 是 当 1ogger 发 送 消息 时 ， 它 用 标记 字符 
串 来 确定 应 该 记录 到 哪 一 个 日 志文 件 中 。syslogd 使 用 与 日 志 相 关联 的 TAG 来 决定 
应 该 将 其 记录 到 哪 一 个 文件 中 ,你 可 以 从 /etc/rsyslog.d/ 目 录 下 的 配置 文件 中 看 到 标记 
字符 串 以 及 与 其 相关 联 的 日 志文 件 。 


(3) 要 将 另 一 个 日 志文 件 的 最 后 一 行 记 录 到 系统 日 志 中 ， 可 以 使 用 : 





























$ logger -f /var/log/source.log 


8.9.3 ”参考 


3.13 节 讲解 了 head 和 tail 命 令 。 


8.10 通过 监视 用 户 登 录 找 出 入 侵 者 
日 志文 件 可 以 用 于 收集 系统 状态 的 详细 有 关 信 息 。 下 面 是 一 个 脚本 相关 的 问题 描述 。 


我 们 有 一 个 通过 SSH 连 接 到 Intemet 的 系统 。 很 多 攻击 者 试图 登入 这 个 系统 ， 因 此 需要 利用 
shell 脚 本 来 设计 一 个 人 侵 检 测 系统 。 人 侵 者 定义 为 : 屡次 试图 登 人 系统 达 两 分 钟 以 上 ， 并且 期 间 
的 登录 过 程 全 部 失败 。 凡 是 这 类 用 户 都 应 该 被 检测 出 来 并 生成 包含 以 下 细节 信息 的 报告 : 
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口 试图 登录 的 账 
口 试图 登录 的 次 


凡凡 











口 进行 登录 的 时 


8.10.1 预备 知识 


我 们 可 以 编写 
登录 失败 的 情况 ， 


户 ; 
数 ; 


口 攻击 者 的 他 地址 ; 
口 IP 地 址 所 对 应 的 主机 ; 


间 段 。 





Dee 对 日 志文 件 进行 扫描 并 从 中 收集 所 需要 的 信息 。 为 了 人 处理 SSH 





还 得 知道 用 户 认证 会 话 日 日 志文 件 /var/log/auth.log 中 。 脚 本 需要 


扫描 这 个 日 志文 件 来 检测 出 失败 的 登录 信息 ， 执 行 各 种 检查 来 获取 所 需要 的 数据 。 我 们 可 以 用 
host 命 令 找 出 IP 地 址 所 对 应 的 主机 。 


8.10.2 ”实战 演练 


接 下 来 编写 一 个 人 侵 检测 脚本 ， 它 利用 用 户 认证 日 志文 件 来 生成 有 关 入 侵 者 的 报告 : 


#!/bin/bash 


# 文 件 名 :intruder i 


detect.sh 


# 用 途 : 入 侵 报告 工具 ， 以 auth.1log 作 为 日 志文 件 


AUTHLOG=/var/1o 


EE [和 交 区 于 站 这 
then 
AUTHLOG=$1 
echo Using Lo 
fi 


LOG=/tmp/valid. 


grep -V "invali 
users=$ (grep "下 


printf "%-5s|%- 
"Host_Mapping" 


ucount=0; 


g/auth.1log 


g file : SAUTHLOG 


$$.10g 
d" SAUTHLOG > $LOG 
ailed password" S$LOG | awk '{ print $(NF-5) }' | sort | uniqg) 


10s|%-10s|%-13s|%-33s|%s\n" "Sr#" "User" "Attempts" "IP address" 
"Time range" 





ip_list="$ (egrep -o "[0-9]+\.[0-9]+\.[0-9]+\.[0-9]+" $LOG | sort | uniG)" 


Pop 
do 
grep Sip $LOG 


Te; 


> /tmp/temp.$$.1o0g 





for user in Susers; 
do 
grep Suser /tmp/temp.$$.1o0g> /tmp/$$.1og 
cut -c-16 /tmp/SS.1og > $$.time 
tstart=$ (head -1 $$.time); 
start=$ (date -Q "$s$tstart" "+%s"); 
tend=$ (tail -1 $$.time); 
end=$ (date -qd "S$tend" "+%s") 


limit=$(( Send - $start )) 
if [ $limit -gt 120 ]; 


then 
let ucount++; 


IP=$ (egrep -o "[0-9]+\.[0-9]+\.[0-9]+\.[0-9]+" /tmp/$$.lo0g | head -1 ); 


TIME RANGE="$tstart-->s$stend" 





ATTEMPTS=$ (cat /tmp/$$.1log|wc -1); 


HOST=$ (host $IP | awk '{ print SNF }' ) 


printf "%$-5s|%-10s|%-10s|%-10s|%-33s|%-s\n" "$ucount" "$user" "$ATTEMPTS" "$IP" 
"SHOST" "S$TIME RANGE"; 
FE 证 
done 








done 


rm/tmp/valid.s$$.log/tmp/$$.l1og $$.time/tmp/temp.$$.1o0og 2>/dev/null 


输出 样 例如 下 : 











slynux@slyno%-laptop:~$ ./intruder detect.sh sampleauth.loog 

Using Log file : sampleauth.log 

Sr# |User IAttempts|IP address |Host Mapping |Time range 

1 lalice |3 1293.119.259.34|attk1.foo.com|Dct 29 05:28:59 —->0ct 29 85:31:59 
2 |bob1 13 1293.1109.251.31|attk2.foo.com|Dct 29 85:21;52 一 ->0ct 29 85:29:52 
3 |bob2 13 |293.1109.250.34|1attk1.foo.com|Dct 29 85:22:59 一 ->0ct 29 85:25:52 
4 lavraiu |28 1293.1109.251.31|attk2.foo.com|Dct 28 84:37:18 ——>0ct 29 95:19:09 
5 |root 121 1293.118.253.32|attk3. foo.com|Dct 29 95:18:01 —->0ct 29 85:37:81 





8.10.3 工作 原理 
在 intruder_detect.sh 脚 本 中 ， 我 们 将 auth.log 文 件 作 为 输入 。 也 可 以 用 脚本 的 命令 行 参数 来 提 


8.11 ”监视 远程 磁盘 的 健康 情况 255 








供 一 个 日 志文 件 作为 输入 ,或 者 默认 读 取 /var/log/auth.log。 我 们 只 需要 记录 合法 用 户 的 登录 日 志 
详情 。 如 果 有 非法 用 户 企 图 登录 ， 则 类 似 于 Failed password for invalid user bob from 
203.83. 248.32 port 7016 ssh2 的 日 志 就 会 出 现在 auth.log 中 。 因 此 我 们 需要 排除 日 志文 件 
中 所 有 包含 ijnvalid 的 行 。grep 命 令 的 反 转 选项 ( -v ) 可 以 用 来 移 除 对 应 非法 用 户 的 所 有 日 志 
内 容 。 下 一 步 是 找 出 试图 登录 并 且 失 败 的 用 户 列表 。 对 于 密码 错误 , SSH 会 记录 类 似 的 日 志 信 息 : 
sshd[21197]: Failed password for bob1 from 203.83.248.32 port 50035 ssh2, 
所 以 我 们 应 找 出 所 有 包含 “faileqd password” 的 行 。 


接 下 来 ,要 找 出 所 有 不 重复 的 IP 地 址 以 提取 对 应 于 每 一 个 IP 地 址 的 日 志 行 。 提 取 IP 地 址 列表 
可 以 用 匹配 IP 地 址 的 正则 表达 式 和 egrep 命 令 来 完成 。 用 for 循 环 对 人 P 地 址 进行 迭代 ， 并 用 grep 
找 出 对 应 的 日 志 行 并 将 其 写 入 临时 文件 。 日志 行 中 倒数 第 6 个 单词 是 用 户 名 ( 例如 bobl ), 可 用 awk 
命令 提取 用 户 名 ( 倒数 第 6 个 单词 )。NF 返 回 最 后 一 个 单词 的 列 号 ， 因 此 NF -5 就 是 倒数 第 6 个 单 
词 的 列 号 。 我 们 再 用 sort 和 uniq 生 成 一 个 没有 重复 的 用 户 列 表 。 


现在 我 们 要 收集 表明 登录 失败 的 日 志 行 ， 这 些 行 中 包含 了 用 户 名 。for 循 环 用 来 读 取 对 应 每 
一 位 用 户 的 日 志 行 ， 并 将 这 些 行 写 人 临时 文件 。 每 一 行 的 前 16 个 字符 是 时 间 戳 ， 可 用 cut 命 令 进 
行 提取 。 一 旦 得 到 了 一 个 用 户 所 有 登录 失败 的 时 间 戳 ,就 要 检查 第 一 次 和 最 后 一 次 试图 登录 之 间 
的 时 间 差 。 第 一 行 日 志 对 应 第 一 次 登录 ， 最 后 一 行 日 志 对 应 最 后 一 次 登录 。 我 们 用 head -1 提取 
首 行 ， 用 tail -1 提取 未 行 。 这 样 就 有 了 首次 登录 (tstart ) 和 末次 登录 ( tends ) 的 字符 串 
格式 的 时 间 怜 。 使 用 aate 命 令 , 我 们 可 以 将 字符 串 形式 的 日 期 转换 成 Unix 纪 元 时 的 总 秒 数 (1.10 
节 讲 解 了 Unix 纪 元 时 )。 


变量 start 和 end 中 包含 着 秒 数 , 分 别 对 应 于 字符 串 形 式 的 起 始 时 间 戳 。 对 这 两 个 时 间 求 差 ， 
并 检查 差 值 是 否 大 于 2 分 钟 ( 即 120 秒 )， 如果 某 个 用 户 被 确认 为 入 侵 者 ， 其 对 应 的 细 闻 信息 就 要 
生成 日 志 。IP 地 址 可 以 用 正则 表达 式 和 egrep 命 令 从 日 志 中 提取 。 试 图 登录 的 次 数 就 是 含有 某 个 
用 户 的 日 志 行 数 。 这 个 行 数 可 以 用 wc 命令 获得 。 人 P 地 址 到 主机 名 的 映射 可 以 将 IP 地 址 作为 host 
命令 的 参数 ,然后 从 命令 输出 中 提取 。 时 间 范 围 可 以 用 已 经 提取 到 的 时 间 惟 来 打印 。 最 后 ,删除 
脚本 使 用 过 的 临时 文件 。 


上 方 的 脚本 旨 在 演示 一 个 用 于 扫描 日 志 并 从 中 生成 报告 的 模型 。 我 们 尽力 让 脚本 更 短小 简 
单 ， 以 避免 过 于 复杂 ， 因 此 难免 存在 一 些 bug。 你 可 以 使 用 更 好 的 处 理 逻 辑 来 改进 该 脚本 。 

































































8.11 监视 远程 磁盘 的 健康 情 ; 


网 络 是 由 不 同 用 户 的 多 台 主 机 组 成 。 它 需要 对 远程 主机 的 磁盘 使 用 情况 实施 集中 监视 。 网络 
的 系统 管理 员 得 每 天 记录 网 络 中 所 有 主机 的 磁盘 使 用 ,日 志 的 每 一 行 应 该 包含 日 期 、 主 机 IP 地 址 、 
设备 、 设 备 容量 、 占 用 空间 、 剩 余 空 间 、 使 用 比例 、 健 康 状 况 等 细节 信息 。 如 果 远 程 主机 中 的 任 
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意 分 区 使 用 率 超 过 了 80%， 那么 健康 状态 应 该 被 设置 为 ALERT， 否则 就 可 以 设置 为 SAFE。 这 则 攻 











略 将 演示 如 何 编写 一 个 可 以 收集 网 络 远程 主 机 详细 信息 的 监视 脚本 。 


8.11.1 预备 知识 








我 们 需要 从 网 络 中 收集 每 台 主 机 的 磁盘 使 用 情况 信息 , 然后 写 入 中 央 主 机 的 日 志文 件 中 。 可 
以 将 负责 收集 信息 并 写 入 日 志 的 脚本 调度 为 每 天 的 特定 时 间 执 行 。 可 以 使 用 SSH 来 登录 远程 系统 














收集 磁盘 使 用 情况 。 


8.11.2 ”实战 演练 
首先 得 在 网 络 中 的 所 有 远程 主机 上 设置 一 个 共用 账户 ,这 个 账户 供 朋 





[本 disklog 登 录 系统 使 





用 。 我 们 需要 为 这 个 账户 配置 SSH 自 动 登录 (7.8 节 讲解 了 自动 登录 的 配置 方法 )。 假 设 在 所 有 配 
置 了 自动 登录 的 远程 主机 上 都 有 一 个 叫做 test 的 用 户 ， 那 么 来 看 看 这 个 shell 脚 本 : 





#!/bin/bash 
# 文 件 名 : disklog.sh 
# 用 途 : 监视 远程 系统 的 磁盘 使 用 情况 


logfile="diskusage.1log" 


if [[ -=n $1 ]] 
then 
logfile=$1 
下 于 
if [ ! -e $logfile | 
then 


printf "%-8s %-14s %$-9s %$-8s %-6s %-6s %$-6s Ss\n" "Date" "I 
"Capacity" "Used" "Free" "Percent" "Status" > $logfile 
王 主 


IP_LIST="127.0.0.1 0.0.0.0" 
# 提 供 远 程 主机 IP 地 址 列表 


( 
for ip in $IP_ LIST; 
do 
#Sslynux 是 用 户 名 ， 可 以 按照 实际 情况 进行 修改 
ssh slynux@s$sip 'df -H' | grep “/dev/ > /tmp/$$.df 


while read line; 


P address" "Device" 
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do 
cur_date=$ (date +%D) 
printf "%-8s g%-14s " $cur_ date $ip 
echo S$line | awk '{ printf("%$-9s %-8s %$-6s %$-6s %$-8s",$1,$2,$3,$4,$5); }' 


pusg=$ (echo $line | egrep -o "[0-9]+%") 
pusg=$ {pusg/\%/}; 
if [ Spusg -lt 80 ]; 
then 
echo SAFE 
else 
echo ALERT 
fi 








done< /tmp/$s$.df 
done 


太吉 gil 


我 们 可 以 用 cron 以 固定 的 间隔 来 调度 脚本 执行 ， 例 如 在 crontab 中 写 和 以 下 条 目 ， 就 可 以 
在 每 天 上 午 10 点 运行 该 脚本 : 








00 10 * * * /home/path/disklog.sh /home/user/diskusg.log 
执行 命令 crontab -e， 然 后 添加 上 面 一 行 。 也 可 以 手动 执行 脚本 : 
$ ./disklog.sh 


脚本 的 输出 样 例如 下 : 











slynyxBslynux-laptop:~/book$ cat diskusage,. Log 

Date IP address Device Capacity Used Free Percent Status 
12/15/18 127.0.8.1 /dev/sdal 9.96 2.46 7.8G 26% SAFE 
12/15/18 9.0.0.8 /dev/sdal 9.96 2.46 7.8G 26% SAFE 








8.11.3 工作 原理 


在 脚本 disklog.sh 中 , 我 们 可 以 提供 日 志文 件 路 径 作为 命令 行 参 数 , 否则 脚本 使 用 默认 的 日 志 
文件 。 如 果 日 志文 件 不 存在 ， 它 会 将 日 志文 件 头 部 写 入 新 文件 中 。-e logfile 用 来 检查 文件 是 
否 存 在 。 远 程 主机 的 全 地 址 列表 被 存储 在 变量 IP_LIST 中 ,彼此 之 间 以 空格 分 隔 。 要 确保 在 
IP_LIST 中 列 出 的 所 有 远程 系统 中 都 有 用 户 test， 并且 SSH 已 经 配置 了 自动 登录 。for 循 环 用 来 
对 JP 地址 进行 逐个 迭代 。 通 过 ssh 使 用 远程 命令 df -H 获 取 磁 盘 剩余 空间 。 这 项 数据 被 存储 在 一 
个 临时 文件 中 。while 循 环 用 来 逐 行 读 取 这 个 文件 。 利 用 awk 提取 并 打印 数据 ， 同 时 一 并 打印 的 
还 有 日 期 。 用 egrep 提 取 使 用 率 ， 并 将 gs 删除 以 获取 使 用 率 的 数值 部 分 。 检 查 得 到 的 数值 ， 看 是 
否 超过 了 80。 如 果 不 足 80, 将 状态 设置 为 saAFT; 如 果 大 于 或 等 于 80， 则 将 状态 设置 为 ALERT。 打 
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印 出 来 的 所 有 数据 要 被 重 定 向 到 日 志文 件 中 。 因 此 代码 被 放 人 子 shel1 () 中 , 并 将 标准 输出 重 定 
向 到 日 志文 件 。 
8.11.4 ”参考 


9.7 节 讲解 了 crontab 命 令 。 


8.12 找 出 系统 中 用 户 的 活跃 时 段 


考虑 一 个 使 用 共享 主机 的 Web 服 务 器 。 每 天 都 会 有 很 多 用 户 登录 和 注销 ， 用 户 活动 都 被 记 入 
了 服务 器 的 系统 日 志 。 这 则 攻略 是 一 项 实践 任务 : 利用 系统 日 志 找 出 每 个 用 户 在 服务 右上 停留 了 
多 久 ， 并 根据 其 时 间 长 短 来 进行 分 级 ,最 后 生成 一 份 包含 等 级 、 用 户 名 、 首 次 登录 时 间 、 末 次 登 
录 时 间 、 登 录 次 数 以 及 总 使 用 时 长 等 细节 信息 的 报告 。 让 我 们 看 看 如 何 解决 这 个 问题 。 























8.12.1 预备 知识 


Last 命 令 用 来 列 出 系统 中 有 关 用 户 登 录 会 话 的 细节 。 这 些 会 话 数据 被 存储 在 /varlog/wtmp 文 
件 中 。 通 过 分 别 累计 各 用 户 的 会 话 时 间 ， 就 能 得 出 他 们 的 总 使 用 时 间 。 





8.12.2 ”实战 演练 
研究 一 下 这 个 用 来 找 出 活跃 用 户 并 生成 报告 的 脚本 : 








#!/bin/bash 
# 用 户 名 : active users.sh 


# 用 途 :查找 活 跃 用户 


log=/var/log/wtmp 


3 
then 

log=$1 
下 于 


printf "%-4s %-10s %-10s %-6s %-8s\n" "Rank" "User" "Start" "Logins" "Usage hours" 
last -f $log | head -n -2 > /tmp/ulog.s$s$ 

cat /tmp/ulog.$$ | cut -d' ' -fl | sort | uniq> /tmp/users.$s$ 

( 


while read user; 
do 
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grep ^Suser /tmp/ulog.$$ > /tmp/user.s$s 
minutes=0 


while read 七 
do 
s=$(echo $t | awk -F: '{ print ($1 * 60) + $2 }') 
let minutes=minutes+s 
done< <(cat /tmp/user.s$s | awk '{ print SNF }' | Ce 


firstlog=$ (tail -n 1 /tmp/user.$$ | awk '{ print $5,$6 }') 
nlogins=$ (cat /tmp/user.$$ | wc -1) 
hours=$ (echo "Sminutes / 60.0" | bc) 


printf "%-10s %-10s %-6s %-8s\n" Suser "$firstlog" Snlogins Shours 
done< /tmp/users.s$s 


) | sort -nrk 4 | awk '{ printf("%-4s %s\n", NR, $0) }' 
rm /tmp/users.$$ /tmp/user.$$ /tmp/ulog.s$s 


输出 样 例如 下 : 

$ ./active users.sh 

Rank User Start Logins Usage hours 
1 easyibaa Dec 11 531 349 
2 demoproj Dec 10 350 230 
3 kjayaram Dec 9 213 55 
4 cinenews Dec 11 85 139 
5 thebenga Dec 10 54 35 
6 gateway2 Dec 11 52 34 
7 soft132 Dec 12 49 25 
8 sarathla Nov 1 45 29 
9 gtsminis Dec 11 41 26 
10 agentcde Dec 13 39 32 


8.12.3 工作 原理 


在 脚本 active_users.sh 中 ， 需 要 提供 日 志文 件 作为 命令 行 参数 ， 和 否则 就 使 用 默认 的 日 志文 件 
wtmp。 命令 last -用 来 打印 日 志文 件 的 内 容 。 日 志文 件 的 第 一 列 是 用 户 名 。 我 们 用 cut 从 中 提 
取 第 一 列 ， 然 后 用 sort 和 unig 找 出 不 重复 的 用 户 。 对 于 每 一 位 用 户 ， 用 grep 找 出 其 对 应 登录 会 
话 的 日 志 行 并 写 入 一 个 临时 文件 。 日 志 的 最 后 一 列 是 用 户 登录 会 话 的 时 长 。 为 了 找 出 用 户 总 的 使 
用 时 间 ， 需 要 累加 所 有 的 会 话 时 长 。 使 用 时 间 的 格式 是 (小 时 : 秒 ),， 需要 用 一 个 简单 的 awk 肢 
本 将 其 转换 成 分 钟 。 


要 提取 用 户 的 会 话 时 长 ， 得 使 用 awk 命 令 。 要 移 除 括号 ， 得 使 用 tr -d。 用 <( COMMANDS ) 
操作 符 将 使 用 时 长 字符 串 列表 作为 标准 输入 传递 给 while 循 环 ， 其 作用 就 相当 于 文件 输入 。 利 用 
date 命 令 将 每 一 个 时 长 字符 串 转 换 成 秒 数 ， 并 累加 到 变量 seconds 中 。 把 出 现在 最 后 一 行 的 用 
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户 的 首次 登录 时 间 提 取出 来 。 登 录 次 数 就 是 日 志 的 行 数 。 要 根据 总 的 使 用 时 间 来 计算 每 位 用 户 的 
等 级 , 数据 记录 以 使 用 时 长 为 键 , 进行 降序 排列 。 用 sort 命 令 的 -nz 选项 指定 按照 数值 逆序 排列 。 
-k4 指 定 键 的 列 号 ( 即使 用 时 长 )。 最 后 ，sort 的 输出 被 传递 给 awk。awk 命 令 为 每 一 行 添加 上 行 
号 ， 这 个 行 号 就 是 每 一 位 用 户 的 等 级 。 














8.13 ”电源 使 用 的 测量 与 优化 


必须 时 刻 关 注 电 源 的 消耗 , 尤其 对 于 笔记 本 电脑 、 平 板 电 脑 等 移动 设备 而 言 更 是 如 此 。Linux 
系统 中 有 几 个 工具 可 以 测量 电源 的 使 用 情况 ，powertop 就 是 其 中 之 一 ， 我 们 将 在 本 攻略 中 学 习 
它 的 用 法 。 
































8.13.1 预备 知识 
powertop 在 多 数 Linux 发 布 版 中 都 没有 被 预 装 ， 你 得 使 用 软件 包 管理 器 自行 安装 。 


8.13.2 ”实战 演练 
来 看 看 如 何 使 用 powertop 来 对 电源 使 用 进行 测量 及 优化 。 
(1) powertop 的 用 法 相当 简单 ， 只 需要 运行 以 下 命令 即 可 : 





























# powertop 
随后 powertop 就 会 开始 进行 测量 , 测量 结束 之 后 会 显示 出 有 关 电 源 使 用 情况 、 耗 电 
最 多 的 进程 等 详细 信息 ， 如 图 8-1 所 示 : 


Tunables 








tats Device Stats 














8.14 ”监视 磁盘 活动 261 





(2) 生成 HTML 格 式 的 报表 : 
# powertop --html 


powetrtop 会 进行 一 段 时 间 的 测量 ， 然 后 生成 一 份 默认 名 称 为 PowerTOPhtml 的 
HTML 报 表 ， 你 可 以 使 用 Web 浏 览 器 进行 浏览 。 


(3) 优化 电源 使 用 : 


在 powertop 运 行 时 , 可 以 使 用 箭头 键 切换 到 Tunables 标 签 。 该 标签 下 包含 了 一 系列 
可 由 powertop 调 节 的 选项 , 借以 降低 电源 消耗 。 只 需要 选中 希望 调节 的 选项 , 按 回 
车 键 将 选项 从 Bad 切 换 到 Good， 如 图 8-2 所 示 。 















































PowerTop 2.1 Dverview idle stats Frequency stats Device stats BE 











图 8-2 
» 如 果 想 监视 可 移动 设备 的 电池 消耗 肖 况 ， 需 要 拔 掉 设 备 的 充电 
器 ， 使 用 powertop 对 电池 进行 测量 。 


8.14 监视 磁盘 活动 


监视 类 工具 的 名 称 流行 以 top ( 进程 监视 命令 ) 作为 结尾 ,依照 这 种 命名 习惯 ， 监 视 磁 盘 IO 
的 工具 就 叫做 iotop。 








8.14.1 预备 知识 
iotop 在 多 数 Linux 发 布 版 中 都 没有 被 预 装 ， 你 得 使 用 软件 包 管 理 器 自行 安装 。 
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8.14.2 ”实战 演练 
使 用 iotop 进 行 WO 监 视 的 方法 多 种 多 样 ， 在 这 则 攻略 中 会 涉及 其 中 的 几 种 。 


(1) 交互 式 监视 : 





# iotop -o 
iotop 的 -o 选 项 只 显示 出 那些 正在 进行 WO 活动 的 进程 。 该 选项 有 助 于 减少 输出 干扰 。 
(2) 用 于 shell 脚 本 的 非 交 互 式 用 法 : 
# iotop -b -n 2 
这 使 得 iotop 打 印 出 两 次 统计 数据 ， 然 后 退出 。 如 果 你 希望 在 shell 脚 本 中 获得 输出 
结果 并 对 其 进行 处 理 ， 这 种 用 法 就 能 派 上 用 场 了 。 
(3) 监视 特定 进程 
# iotop -p PID 


使 用 你 希望 对 其 进行 监视 的 进程 的 PID，iotop 就 只 会 输出 该 进程 的 统计 信息 。 














| 在 大 多 数 现代 Linux 发 布 版 中 ， 无 需 先 查找 PID ， 然 后 再 提供 给 
iotop。 你 可 以 使 用 pidof 命 令 ， 将 之 前 的 命令 写成 如 下 形式 : 


# iotop -p 'bidof cp 


8.15 ”检查 磁盘 及 文件 系统 错误 


数据 是 计算 机 系统 中 最 重要 的 东西 。 因 而 对 存储 在 物理 介质 上 数据 的 一 致 性 进行 监视 自然 也 
就 很 重要 了 。 








8.15.1 预备 知识 


我 们 将 会 使 用 标准 工具 fsck 来 检查 文件 系统 错误 。 该 命令 应 该 已 经 预 装 在 所 有 的 Linux 发 布 
版 中 了 。 如 果 没 有 预 装 ， 请 使 用 软件 包 管 理 器 自行 安装 。 





8.15.2 ”实战 演练 
来 看 看 如 何 使 用 fsck 的 各 种 选项 对 文件 系统 错误 进行 检查 和 修复 。 
(1) 要 检查 分 区 或 文件 系统 的 错误 ， 只 需要 将 路 径 作 为 fsck 的 参数 : 


# Esck /dev/sdb3 
fsck from util-linux 2.20.1 
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e2fsck 1.42.5 (29-Jul-2012) 


HDD2 
Pass 
Pass 
Pass 
Pass 
Pass 


HDD2: 


has been mounted 26 times without being checked, check forced. 


1: 


2 
3: 
4 
5 


Checking inodes, blocks, and sizes 

: Checking directory structure 

Checking directory connectivity 

: Checking reference counts 

: Checking group summary information 

75540/16138240 files (0.7% non-contiguous), 48756390/64529088 blocks 


(2) 检查 /etc/fstab 中 所 配置 的 所 有 文件 系统 : 
# fsck -A 


该 命令 会 依次 检查 /etc/fstab 中 列 出 的 文件 系统 。fstab 文 件 对 磁盘 及 其 挂 载 点 之 间 的 
映射 关系 进行 了 配置 ， 以 便于 更 便捷 地 挂 载 文件 系统 。 这 也 使 得 在 系统 启动 的 过 程 
中 能 够 挂 载 某 些 文件 系统 。 


(3) 指定 fsck 自 动 修复 错误 ， 无 需 询问 是 否 进行 修复 : 





# Esck -a /dev/sda2 


(4) 模拟 fsck 要 执行 的 操作 : 


# fsck -AN 

fsck from util-linux 2.20.1 

[/sbin/fsck.ext4 (1) -- /] fsck.ext4 /dev/sda8 
[/sbin/fsck.ext4 (1) -- /home] fsck.ext4 /dev/sda7 
[/sbin/fsck.ext3 (1) -- /media/Data] fsck.ext3 /dev/sda6 


该 命令 会 打印 出 fsck 将 要 执行 什么 样 的 操作 ( 检查 所 有 的 文件 系统 )。 


8.15.3 工作 原理 

fsck 不 过 是 一 个 前 端 程序 而 已 ， 对 于 各 类 文件 系统 而 言 ， 都 有 其 针对 性 的 Esck 程 序 。 当 执 
行 fsck 时 , 它 会 自动 检测 文件 系统 类 型 ,然后 运行 对 应 的 fsck. fstype 命 令 ， 其 中 fstype 是 文 
件 系统 的 类 型 。 如 果 我 们 在 ext4 文 件 系统 上 执行 Esck， 它 最 终 会 调用 fsck .ext4 命 令 。 


正 因为 如 此 ， 你 会 发 现 fsck 本 身 只 支持 所 有 这 些 特定 文件 系统 工具 所 共有 的 选项 。 要 查找 
更 详细 的 选项 ， 请 查找 特定 工具 ( 如 fsck.ext4 ) 的 手册 页 。 























如 果 怀 疑 文件 系统 受 损 ， 需 要 使 用 fsck 进 行 修复 时 ， 对 fsck 操 作 进行 模拟 则 不 无 益处 。 
为 必须 确保 fsck 不 会 执行 我 们 不 希望 进行 的 操作 。 比 如 说 ,fsck 可 能 会 将 某 些 鹿 区 标 为 坏 鹿 区 ， 
但 我 们 却 希望 从 中 恢复 数据 。 在 这 种 情况 下 ， 我 们 只 让 fsck 做 一 个 演习 ， 打 印 出 所 要 进行 的 操 
作 ， 而 不 是 真正 进行 操作 。 
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本 章 内 容 

口 收集 进程 信息 口 从 Bash 中 读 写 MySQLI 数 据 库 
口 杀 死 进程 以 及 发 送 或 响应 信号 口 用 户 管理 脚本 

口 向 用 户 终端 发 送 消息 口 图 像 文件 的 缩放 及 格式 转换 
口 采集 系统 信息 口 在 终端 下 进行 截屏 

口 使 用 /proc 采 集 信 息 口 管理 多 个 终端 

口 使 用 cron 进 行 调度 





9.1 简介 





GNU/Linux 的 生态 系统 是 由 运行 的 程序 、 服 务 、 所 连接 的 设备 、 文 件 系 统 、 用 户 等 组 成 的 。 
系统 管理 的 主要 目的 在 于 对 整个 系统 形成 一 个 概观 并 对 操作 系统 进行 整体 上 的 管理 。 我 们 应 该 党 
握 用 于 系统 信息 收集 及 资源 管理 的 常用 命令 以 及 实践 用 法 , 这 也 有 助 于 编写 脚本 和 使 用 自动 化 工 
有 具 。 本 章 将 介绍 一 些 此 类 工具 的 用 法 。 








9.2 ”收集 进程 信息 


进程 是 程序 的 运行 实例 ( running instance )。 运行 在 一 台 计 算 机 中 的 多 个 进程 都 被 分 配 了 一 个 
称 为 进程 ID (PID ) 的 唯一 标识 数字 。 同 一 个 程序 的 多 个 实例 可 以 同时 运行 ， 但 是 它们 的 PID 却 
互 不 相同 。 进 程 包括 多 种 属性 ， 例 如 拥有 该 进程 的 用 户 、 进 程 使 用 的 内 存 数量 、 进 程 占 用 的 CPU 
时 间 等 。 这 则 攻略 将 学 习 如 何 收集 有 关 进 程 的 信息 。 
























































9.2.1 预备 知识 
和 进程 管理 相关 的 重要 命令 是 top 、ps 和 pgrep。 让 我 们 看 看 如 何 收集 进程 信息 。 
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9.2.2 ”实战 演练 


ps 是 收集 进程 信息 的 重要 工具 。 它 提供 的 信息 包括 : 拥有 进程 的 用 户 、 进 程 的 起 始 时 间 、 
进程 对 应 的 命令 行路 径 、PID、 进程 所 属 的 终端 ( TTY )、 进程 使 用 的 内 存 、 进 程 占用 的 CPU 等 。 
例如 : 























$ ps 

PID TTY TIME CMD 
1220 pts/0 00:00:00 bash 
1242 pts/0 00:00:00 ps 


ps 命令 通常 结合 一 系列 参数 使 用 。 如 果 不 使 用 任何 参数 ，ps 将 显示 运行 在 当前 终端 (TTY ) 
中 的 进程 。 第 一 列 显示 进程 ID (PID ), 第 二 列 是 TTY (终端 ), 第 三 列 是 进程 启动 后 过 去 的 时 间 ， 
最 后 一 列 是 CMD ( 进程 所 对 应 的 命令 )。 


为 了 包含 更 多 的 信息 ， 可 以 使 用 -f£ (表示 foll ) 来 显示 多 列 ， 如 下 所 示 : 


$ ps -£ 

UID PID PPID CC STIME TTY TIME CMD 
slynux 1220 1219 0 18:18 pts/0 00:00:00 -bash 
slynux 1587 1220 0 18:59 pts/0 00:00:00 ps -f 


上 面 的 ps 命令 没有 什么 用 处 , 因为 它 没有 提供 除 当 前 终端 外 的 任何 进程 信息 。 要 获取 运行 在 系统 
中 的 每 个 进程 的 信息 ， 使 用 选项 -e ( every )。 选 项 -ax (all ) 也 可 以 生成 同样 的 输出 。 














逐 和 项 -x 和 -a 用 来 解除 ps 默认 设置 的 TTY 限 制 ,通常 使 用 不 带 参数 的 ps 命令 
es 出 其 所 属 终端 上 的 进程 。 





运行 如 下 命令 之 一 : ps -e, ps -ef，ps -ax 或 ps -axf。 


$ ps -e | head 

PID TTY TIME CMD 

? 00:00:00 init 
00:00:00 kthreadd 
00:00:00 migration/0 
00:00:00 ksoftirqd/0 
00:00:00 watchdog/0 
00:00:00 events/0 
00:00:00 cpuset 
00:00:00 khelper 
00:00:00 netns 


输出 列表 很 长 。 我 们 使 用 neaq 进 行 了 过 滤 ， 所 以 只 列 出 了 前 10 项 。 
ps 命令 支持 显示 包括 进程 名 及 PID 在 内 的 多 种 信息 。ps 默 认 在 不 同 的 列 中 显示 这 些 信 息 ， 


oA Pp 


YY YY YY YY ‘VY YY oY 
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其 中 的 大 多 数 都 没什么 用 处 。 可 以 用 -o 来 指定 想 要 显示 的 列 ， 以 便 只 打印 出 我 们 需要 的 内 容 。 
与 进程 相关 的 参数 可 以 通过 与 此 参数 对 应 的 命令 选项 指定 。 参数 列表 以 及 -o 的 用 法 在 接 下 来 会 
进行 讨论 。 

用 ps 显示 所 需要 的 输出 列 : 








$ ps [OTHER OPTIONS] -o Parameter1 Parameter2, Parameter3 .. 


-0 的 参数 以 过 号 操作 符 (，) 作为 定 界 符 。 值 得 注意 的 是 ， 喜 号 操作 符 与 它 
分 隔 的 参数 之 间 是 没有 空格 的 。 在 大 多 数 4 青 况 下 ， 选项 - o 都 是 和 选项 - e 结 合 使 
过 > 用 的 ( -oe )， 因 为 它 需要 列 出 运行 在 系统 中 的 每 一 个 进程 。 但 是 如 果 _o 需 要 使 
用 某 些 过 滤器 ， 例 如 列 出 特定 用 户 拥有 的 进程 ， 那 么 就 不 再 使 用 -e。-e 和 过 滤 

器 结合 使 用 没有 任何 实际 效果 ， 依 旧 会 显示 所 有 的 进程 。 


示例 如 下 ， 其 中 comm 表 示 COMMAND，pcpu 表 示 CPU 占 用 率 : 


$ ps -eo comm,pcpu | head 


COMMAND %CPU 
init 0.0 
kthreadd 0.0 
migration/0 0.0 
ksoftirqd/0 0.0 
watchdog/0 0.0 
events/0 0.0 
cpuset 0.0 
khelper gag 
netns 0.0 


9.2.3 工作 原理 
选项 -o 可 以 使 用 不 同 的 参数 ， 这 些 参数 及 其 描述 如 表 9-1 所 示 。 
































表 9-1 
参 数 描 述 
pepu CPU 占用 率 
pid 进程 ID 
ppid 父 进 程 ID 
pmem 内 存 使 用 率 
comm 可 执行 文件 名 
















































































( 续 ) 

参 数 描 述 

cmd 简单 命令 " 

user 启动 进程 的 用 户 

nice 优先 级 

time 累计 的 CPU 时 间 

etime 进程 启动 后 流逝 的 时 间 

tty 所 关联 的 TTY 设 备 

euid 有 效用 户 ID 

stat 进程 状态 


9.2.4 补充 内 容 
让 我 们 看 看 其 他 一 些 进程 控制 命令 的 用 法 。 

















1. 上 op 
top 对 于 系统 管理 员 来 说 是 一 个 极为 重要 的 命令 。 它 默认 会 输出 一 个 占用 CPU 最 多 的 进程 列 
表 。 输 出 结果 每 隔 几 秒 就 会 更 新 。 该 命令 的 用 法 如 下 所 述 。 




















$ top 


除了 若干 个 占用 CPU 最 多 的 进程 外 ， 还 会 显示 进程 相关 的 一 些 其 他 参数 ， 如 图 9-1 所 示 。 





+] Shell ' Shell No.2 
shaan : top - KDE Terminal Emulator < 




















ma 


























中 





AR 类 命令 。 它 是 由 空白 字符 分 隔 的 一 系列 单词 ， 以 shell 控 制 操作 符 作为 结尾 。 
第 一 个 单词 指定 的 命令 ， 余 下 的 单词 作为 命令 参数 。shell 控 制 操作 符 可 以 是 换行 符 ， 或 者 是 | | ,&&,&， 9 


i 
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2. 根据 参数 对 ps 输出 进行 排序 


可 以 用 --sort 将 ps 命令 的 输出 根据 特定 的 列 进行 排序 。 在 参数 前 加 上 + (升序 ) 或 - (降序 ) 
来 指定 排序 方式 : 

$ ps [OPTIONS] --sort -paramterl,+parameter2,parameter3.. 

例如 ， 要 列 出 占用 CPU 最 多 的 10 个 进程 : 


$ ps -eo comm,pcpu --sort -pcpu | head 
COMMAND %CPU 
Xorg 0 
hald-addon-stor 0 
ata/0 0 
scsi eh 0 0 
gnome-settings- 0 
init 0. 
hald 0 
pulseaudio 0 
0 


® »。 +. » .0 。 +. 
O00o0oooooooo 


gdm-simple-gree 
进程 依据 CPU 占 用 率 进行 降序 排序 ， 用 heagd 命 令 提 取 前 10 个 进程 。 


我 们 可 以 用 grep 从 ps 的 输出 中 提取 与 给 定 进程 名 或 其 他 参数 相关 的 条 目 。 要 找 出 与 Bash 进 
程 相关 的 条 目 ， 可 以 使 用 : 











$ ps -eo comm,pid,pcpu,pmem | grep bash 
bash 1255 0.0 00.3 
bash 1680 5.5 0.3 


3. 找 出 给 定 命令 名 所 对 应 的 进程 ID 


假设 某 个 命令 有 多 个 实例 正在 运行 ， 我们 可 能 需要 识别 这 些 进程 的 PID。 该 信息 可 以 使 用 ps 
或 pgrep 命 令 得 到 。 按 照 下 面 的 方式 使 用 ps : 








$ ps -C COMMAND NAME 
或 者 
$ ps -C COMMAND NAME -o pid= 


用 户 自 定义 格式 指示 符 -o 先 前 已 经 讲解 过 了 。 但 是 这 里 你 可 以 看 到 piad 后 面 加 上 了 =， 这 会 去 掉 
ps 输出 中 PID 一 列 的 列 名 。 在 参数 后 加 上 = 就 可 以 移 除 列 名 。 例 如 : 























$ ps -C bash -o pid= 
1255 
1680 
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这 条 命令 列 出 了 所 有 Bash 进 程 的 进程 ID。 
除 此 之 外 ， 还 有 一 个 很 方便 的 工具 pgrep。 你 可 以 用 它 获 得 特定 命令 的 进程 ID 列表 。 例 如 : 


$ pgrep COMMAND 
$ pgrep bash 
1255 

1680 


KW pgrep 只 需要 命令 名 的 一 部 分 作为 输入 参数 来 提取 Bash 命 令 ， 诸 如 pgrep 
ash 或 pgrep bas 都 能 够 奏效 。 但 是 ps 需要 你 输入 命令 准确 的 全 名 。 


pgrep 可 以 接受 多 个 输出 过 滤 选 项 。 如 果 不 使 用 换行 符 作 为 定 界 符 ， 而 是 要 自行 指定 可 以 像 
下 面 这 样 : 
$ pgrep COMMAND -d DELIMITER STRING 


$ pgrep bash -d ":" 
1255:1680 


指定 进程 的 用 户 ( 拥有 者 ) 列表 : 
$ pgrep -u root,slynux COMMAND 
其 中 root 和 sl1ynux 都 是 用 户 和 名。 返回 所 匹配 的 进程 数量 : 
OA 
4. 根据 真实 用 户 或 ID 以 及 有 效用 户 或 |D 过 滤 ps 输 出 


可 以 用 ps 根据 指定 的 真实 /有 效用 户 名 或 ID 对 进程 进行 分 组 。 指 定 的 参数 可 以 用 来 过 滤 ps 的 
输出 : 通过 检查 每 一 个 输出 条 目 是 否 属于 参数 列表 中 指定 的 有 效用 户 或 真实 用 户 , 并 只 显示 匹配 
的 条 目 。 实 现 方法 如 下 : 





























口 用 -u EUSER1,EUSER2 ...， 指 定 有 效用 户 列表 ; 
口 用 -U RUSER1,RUSER2 ...， 指 定 真 实用 户 列 表 。 
例如 : 


$ ps -u root -U root -o user,pcpu 


该 命令 会 显示 以 root 作 为 有 效用 户 ID 和 真实 用 户 ID 的 所 有 进程 ， 以 及 用 户 、CPU 占 用 率 列 。 





在 大 多 数 情况 下 ,-o 都 是 和 -e 结 合成 -eo 的 形式 ,但 是 当 使 用 过 滤器 的 时 候 ， 
-o 应 该 像 上 面 那样 单独 使 用 。 
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5. 用 TTY 过 滤 ps 输 出 
可 以 通过 指定 进程 所 属 的 TTY 选 择 ps 的 输出 。 用 选项 -t 指 定 TTY 列 表 : 








$ ps -t TTY1, TTY2 .. 


例如 : 
$ ps -t pts/0,pts/1 
PID TTY TIME CMD 
1238 pts/0 00:00:00 bash 
1835 pts/1 00:00:00 bash 
1864 pts/0 00:00:00 ps 


进程 线程 的 相关 信息 


通常 与 进程 线程 相关 的 信息 在 ps 输出 中 是 看 不 到 的 。 我 们 可 以 用 选项 -L 在 ps 输出 中 显示 
SS 这 会 显示 出 两 列 : NLWP 和 NLP。NLWP 是 进程 的 线程 数量 ，NLP 是 ps 输出 中 
个 条 目的 线程 ID。 例 如 : 








$ ps -eLf 

或 者 
$ ps -eLf --sort -nlwp | head 
UID PID PPID LWP C NLWP STIME TTY TIME CMD 
root 647 1 647 0 64 14:39 ? 00:00:00 /usr/sbin/ 
console-kit-daemon --no-daemon 
root 647 1 654 0 64 14:39 ? 00:00:00 /usr/sbin/ 
console-kit-daemon --no-daemon 
root 647 1 656 0 64 14:39 ? 00:00:00 /usr/sbin/ 
console-kit-daemon --no-daemon 
root 647 1 657 0 64 14:39 ? 00:00:00 /usr/sbin/ 
console-kit-daemon --no-daemon 
root 647 1 658 0 64 14:39 ? 00:00:00 /usr/sbin/ 
console-kit-daemon --no-daemon 
root 647 1 659 0 64 14:39 ? 00:00:00 /usr/sbin/ 
console-kit-daemon --no-daemon 
root 647 1 660 0 64 14:39 ? 00:00:00 /usr/sbin/ 
console-kit-daemon --no-daemon 
root 647 1 662 0 64 14:39 ? 00:00:00 /usr/sbin/ 
console-kit-daemon --no-daemon 
root 647 1 663 0 64 14:39 ? 00:00:00 /usr/sbin/ 


console-kit-daemon --no-daemon 


该 命令 列 出 了 线程 数 最 多 的 10 个 进程 。 
7. 指定 输出 宽度 以 及 所 要 显示 的 列 
我 们 可 以 使 用 用 户 自 定义 的 输出 格式 指示 符 -o 来 指定 在 ps 输出 中 所 要 显示 的 列 。 另 一 种 指 








定 输出 格式 的 方法 是 使 用 标准 选项 。 可 以 按照 你 自己 的 使 用 方式 来 进行 应 用 。 尝 试 以 下 选 


口 -f ps -ef 
Du ps -eu 
Dps ps -e w(w 表 示 宽 松 输出 ) 





8. 显示 进程 的 环境 变量 


了 解 某 个 进程 依赖 哪些 环境 变量 , 这 类 信息 我 们 通常 都 用 得 着 。 进 程 的 运行 方式 可 能 极其 依 
赖 某 组 环境 变量 。 我 们 可 以 利用 环境 变量 调试 并 修复 与 进程 相关 的 问题 。 


要 在 ps 的 输出 条 目 中 同时 列 出 环境 变量 ， 可 以 使 用 : 











$ ps -eo cmd e 
例如 : 


$ ps -eo pid,cmd e | tail -n 3 

1162 hald-addon-acpi: listening on acpid socket /var/run/acpid.socket 

1172 sshd: slynux [priv] 

1237 sshd: slynux@pts/0 

1238 -bash USER=slynux LOGNAME=slynux HOME=/home/slynux 
PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games 
MAIL=/var/mail/slynux SHELL=/bin/bash SSH CLIENT=10.211.55.2 49277 22 
SSH_CONNECTION=10.211.55.2 49277 10.211.55.4 22 SSH TTY=/dev/pts/0 TERM=xterm-color 
LANG=en_IN XDG SESSION COOKIE=dle96f5cc8a7a3bc3a0a73e44c95121a-1286499339. 
592429-1573657095 


这 种 跟踪 环境 方法 的 用 途 之 一 就 是 解决 apt-get 软 件 包 管理 器 的 故障 。 如 果 你 是 用 HTTP 代 理 连 
接 Internet， 可 能 得 设置 环境 变量 http_proxy=host :port。 如 果 你 在 脚本 中 忘记 设置 该 环境 变 
量 , 那么 apt-get 就 没 法 选择 代理 服务 器 并 将 返回 一 个 错误 。 这 时 就 得 查看 环境 变量 ,查找 问题 
所 在 。 

我 们 可 能 需要 借助 crontab 这 类 调度 工具 来 使 一 些 应 用 程序 能 够 自动 运行 。 但 是 这 类 应 用 也 
许 要 依赖 某 些 环境 变量 。 假 六 i mn 一 个 窗口 化 的 GUI 应 用 程序 。 我 们 用 
crontab 将 其 安排 到 指定 的 时 间 ， 但 结果 却 事 与 愿 违 





























00 10 * * * /usr/bin/windowapp 
































这 是 因为 窗口 化 的 应 用 程序 总 是 依赖 于 环境 变量 DISPLAY。 要 想 获 得 所 需 的 环境 变量 , 首先 
手动 运行 windqowapp， 然 后 运行 bs -C windowapp -eo cmdq e。 找 出 对 应 的 环境 变量 ,将 其 











添加 到 crontap 中 的 命令 名 之 前 ， 这 个 问题 就 可 以 搞定 了 : 


00 10 * * * DISPLAY=:0 /usr/bin/windowapp 


这 里 的 DISPLAY=:0 是 从 ps 输出 中 获取 的 。 
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9. which、whereis、file、whatis 与 平均 负载 

有 一 些 命令 可 以 用 来 探究 其 他 的 命令 。 让 我 们 来 看 一 下 。 

D which 
which 命 令 用 来 找 出 某 个 命令 的 位 置 。 我 们 在 终端 输入 命令 时 无 需 知道 对 应 的 可 执行 文件 
位 于 何 处 。 
当 输入 命令 时 ， 终 端 会 在 一 组 位 置 中 查找 这 个 命令 ， 如 果 能 够 找到 ， 那 么 就 执行 该 可 执 
行文 件 。 这 一 组 位 置 由 环境 变量 PATH 指 定 。 例 如 : 


$ echo $PATH 
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games 


我 们 可 以 导出 PATH 并 添上 我 们 自己 的 命令 搜索 位 置 。 如 果 要 将 /home/slynux/bin 添 加 到 
PATH 中 ， 可 以 使 用 以 下 命令 : 


$ export PATH=$PATH: /home/slynux/bin 
# /home/slynux/bin 被 添加 到 PATH 中 


which 命 令 会 输出 作为 其 参数 的 命令 所 在 的 位 置 。 例 如 : 


$s which ls 
/bin/1s 
































D whereis 
whereis 与 which 命 令 类 似 , 但 它 不 仅 返回 命令 的 路 径 , 还 能 够 打印 出 其 对 应 的 命令 手册 
的 位 置 以 及 命令 源 代码 的 路 径 (如 果 有 的 话 )。 例 如 : 


$ whereis 1s 
ls: /bin/ls /usr/share/man/manl/ls.1.gz 


DQ file 
file 命 令 是 一 个 既 有 趣 又 使 用 频繁 的 命令 ， 可 用 来 确定 文件 的 类 型 : 
$ file FILENAME 
该 命令 会 打印 出 与 该 文件 类 型 相关 的 细节 信息 。 
例如 : 


$ file /bin/ls 
/bin/1Ls: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), dynamically linked 
(uses shared libs), for GNU/Linux 2.6.15, stripped 




















D whatis 








whatis 命 令 会 输出 作为 参数 的 命令 的 简短 描述 信息 。 这 些 信息 是 从 命令 手册 中 解析 得 来 
的 。 例如 : 


9.3 杀 死 进程 以 及 发 送 或 响应 信号 273 





$ whatis 1s 
1s (1) - list directory contents 


apropos 


» 有 时 候 我 们 需要 搜索 和 某 个 单词 相关 的 命令 是 否 存在 。 那 么 可 以 
搜索 包含 该 字符 串 命令 的 手册 页 。 为 此 ， 我 们 可 以 使 用 以 下 命令 


apropos COMMAND 


口 平均 负载 


平均 负载 是 系统 总 负载 量 的 一 个 重要 参数 。 它 指明 了 系统 中 可 运行 进程 总 量 的 平均 值 。 
平均 负载 由 三 个 值 来 指定 ， 第 一 个 值 指明 了 1 分 钟 内 的 平均 值 ， 第 二 个 值 指 明了 5 分 钟 内 
的 平均 值 ， 第 三 个 值 指明 了 15 分 钟 内 的 平均 值 。 


这 三 个 值 可 以 通过 运行 uptime 获 得 。 例 如 : 




















$ uptime 
12:40:53 up 6:16, 2 users, load average: 0.00, 0.00, 0.00 


9.2.5 参考 
9.7 节 讲解 了 如 何 调度 任务 。 


9.3 订 死 进程 以 及 发 送 或 响应 信号 


终结 进程 是 我 们 通常 都 会 碰 到 的 事 儿 , 包括 需要 终结 某 个 程序 的 所 有 实例 。 命 令 行 提 供 了 多 
种 用 于 终结 程序 的 方法 。 在 类 Unix 环 境 中 与 进程 相关 的 一 个 重要 概念 就 是 信号 。 信 和 号 是 一 种 进程 
间 通 信 机 制 , 它 用 来 中 断 运行 中 的 进程 以 执行 某 些 操作 。 终止 程序 也 是 通过 使 用 信号 技术 来 实现 
的 。 这 则 攻略 介绍 了 信号 及 其 用 法 。 





















































9.3.1 预备 知识 


信号 是 Linux 中 的 一 种 进程 间 通 信 机 制 。 我 们 可 以 使 用 特定 的 信号 来 中 断 进 程 。 每 一 种 信号 
都 同一 个 整数 值 相关 联 。 当 进程 接收 到 一 个 信号 时 ， 它 会 通过 执行 对 应 的 信号 处 理 程 序 ( signal 
handler ) 来 进行 响应 。 在 shell 脚 本 中 同样 可 以 发 送 、 接 收 并 响应 信号 。ki11 是 用 于 终止 进程 的 信 
号 。 像 Ctrl+C 、Ctrl+Z 这 种 事件 也 会 发 送 各 自 的 信号 。kil11 命 令 可 用 来 向 进程 发 送信 号 ， 而 Etrap 
命令 用 来 处 理 所 接 收 的 信和 号 。 
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9.3.2 ”实战 演练 





(1) 列 出 所 有 可 用 的 信号 : 

$ kill -1 

该 命令 会 打印 出 信号 编号 (signal number ) 以 及 对 应 的 信号 名 称 。 
CO) 终止 进程 


$ kill PROCESS_ID_LIST 
kil11 命 令 默认 发 出 一 个 TERM 信和 号。 进程 ID 列表 使 用 空格 作为 进程 ID 之 间 的 定 界 符 。 
(3) 要 通过 ki11 命 令 向 进程 发 送 指定 的 信号 ， 可 以 使 用 : 


$ kill -s SIGNAL PID 























参数 SIGNAL 要 么 是 信号 名 称 , 要 么 是 信号 编号 。 尽管 有 很 多 信号 可 用 于 不 同 的 目的 ， 
但 经 常用 到 的 其 实 只 有 那么 几 个 ,具体 如 下 所 示 。 





口 SIGHUP 1 一 一 对 控制 进程 或 终端 的 终结 进行 挂 起 检测 ( hangup detection )。 
口 SIGINT 2 一 一 当 按 下 Ctrl + C 时 发 送 该 信号 。 
口 SIGKILL 9 一 一 用 于 强行 杀 死 进程 。 


口 SIGTERM 15 一 一 默认 用 于 终止 进程 。 
口 SIGTSTP 20 一 一 当 按 下 Ctrl + Z 时 发 送 该 信号 。 

















(4) 我 们 经 常 要 强行 杀 死 进程 ， 可 以 使 用 : 





$ kill -s SIGKILL PROCESS_ID 
或 者 
$ kill -9 PROCESS_ID 
9.3.3 ”补充 内 容 
让 我 们 看 看 其 他 一 些 用 于 终止 以 及 向 进程 发 送信 号 的 命令 。 
1. 相关 的 kill 命 令 





kil11 命 令 以 进程 了 作为 参数 。 在 xil11 命 令 系列 中 还 有 其 他 命令 可 以 接受 命令 名 作为 参数 ， 
向 对 应 的 进程 发 送信 号 。 








I 


kil1al11 命 令 通过 命令 名 终止 进程 : 





mm 


$s killall process name 


9.3 杀 死 进程 以 及 发 送 或 响应 信号 275 





通过 名 称 向 进程 发 送信 号 : 
$ killall -s SIGNAL process name 
通过 名 称 强行 杀 死 进程 : 
$ killall -9 process name 
例如 : 
$ killall -9 gedit 
通过 名 称 以 及 所 属 用 户 名 指定 进程 : 
$ killall -u USERNAME process name 
如 果 需 要 在 杀 死 进程 前 进行 确认 ， 可 以 使 用 ki1l1a11 的 -i 选项 。 


pkil1 命 令 和 ki1l1 命 令 类 似 ， 不 过 默认 情况 下 pki1l1 接 受 的 是 进程 名 ， 而 非 进程 ID。 例 如 : 











$ pkill process name 
$ pkill -s SIGNAL process name 


SIGNAL 是 信号 编号 。pkil11 不 支持 信号 名 称 。pkil11 提 供 了 很 多 和 Kil11 相 同 的 选项 。 要 了 解 更 
多 详细 信息 ， 请 参阅 pki11 的 命令 手册 。 
2. 捕捉 并 响应 信和 号 


trap 命 令 在 脚本 中 用 来 为 信号 分 配 信号 处 理 程 序 。 一 旦 使 用 trap 将 某 个 函数 分 配给 一 个 信 
号 ， 那么 当 脚 本 运行 收 到 该 信号 时 ， 其 对 应 的 函数 就 会 开始 执行 。 


命令 语法 如 下 : 
trap 'signal handler function name' SIGNAL LIST 
SIGNAL LIST 以 空格 分 隔 ， 它 可 以 是 信号 编号 或 者 信号 名 称 。 


下 面 是 一 个 能 够 响应 信号 SIGINT 的 shell 脚 本 : 























#/bin/bash 
# 文 件 名 : sighandle.sh 
# 用 途 : 信号 处 理 程序 


function handler() 
{ 

echo Hey, received signal : SIGINT 
} 


echo My process ID is SS 
#$$ 是 一 个 特殊 变量 ， 它 可 以 返回 当前 进程 /脚本 的 进程 ID 
trap 'handler' SIGINT 
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#handler 是 信号 SIGINT 的 信号 处 理 程 序 的 名 称 


while true; 
do 

sleep 1 
done 


在 终端 中 运行 这 个 脚本 。 当 脚本 运行 时 ， 如 果 按 CtrlHC， 就 会 显示 一 条 消息 ， 这 是 通过 执行 与 信 
号 关联 的 信号 处 理 程序 实现 的 。Ctrl+C 会 发 出 一 个 sTGINT 信 和 号 。 


通过 使 用 一 个 无 限 循环 vhile 来 保持 进程 运行 。 这 样 就 可 以 使 它 能 够 响应 另 一 个 进程 以 异步 
方式 发 送 的 信号 。 用 来 保持 进程 一 直 处 于 活动 状态 的 循环 通常 称 为 事件 循环 (event loop ) 。 


我 们 可 以 用 ki11 命 令 以 及 脚本 的 进程 DD 向 脚本 发 送信 号 : 





























$ kill -s SIGINT PROCESS_ID 
上 面 脚本 的 PROCESS_ID 在 执行 时 会 被 打印 出 来 。 或 者 也 可 以 用 ps 命令 找 出 脚本 的 进程 ID。 

如 果 没有 为 信号 指定 信号 处 理 程序 , 那么 将 会 调用 由 操作 系统 默认 分 配 的 信号 处 理 程序 。 
般 来 说 ， 按 下 Ctrl+C 会 终止 程序 ， 因 为 这 是 操作 系统 提供 的 处 理 程序 的 默认 行为 。 不 过 这 里 我 们 
自 定 义 的 信号 处 理 程序 指定 了 在 接收 到 信和 号 后 所 执行 的 操作 。 

通过 trap 命 令 ， 我 们 能 够 为 任何 可 用 的 信号 (kil11 -1 ) 定义 处 理 程序 ， 也 可 以 为 多 个 信 
号 指定 单个 信号 处 理 程序 。 



































9.4 ”向 用 户 终 端 发 送 消息 


系统 管理 员 可 能 需要 疝 网 络 中 所 有 用 户 或 特定 用 户 的 终端 发 送 消 息 。 这 则 攻略 将 指导 你 如 何 
完成 这 项 任务 。 





9.4.1 预备 知识 


wall 命 令 用 来 向 当前 所 有 登录 用 户 的 终端 写 人 消息 。 它 可 以 将 消息 传递 给 一 台 服务 器 中 所 
有 的 登录 用 户 或 是 多 台 分 散 主机 中 的 用 户 。 给 所 有 的 用 户 发 送 消息 未 必 总 是 靠 谱 。 在 Linux 系 统 
中 ,终端 是 作为 设备 存在 的 。 因 此 那些 打开 的 终端 在 /dev/pts/ 中 都 会 有 对 应 的 设备 节点 文件 。 癌 
特定 的 设备 写 和 数据 将 会 在 对 应 的 终端 中 显示 出 消息 。 





9.4.2 ”实战 演练 
向 终端 中 所 有 的 当前 登录 用 户 发 送 广播 消息 : 
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$ cat message | wall 
或 者 


$ wall< message 
Broadcast Message from slynux@slynux-laptop 
(/dev/pts/1) at 12:54 ... 


This is a message 


消息 概要 (message outline ) 会 显示 谁 ( 哪个 用 户 、 哪 台 主 机 ) 发 送 了 这 则 消息 。 如 果 其 他 
用 户 发 送 了 消息 ， 只 有 在 “ 写 和 人 消息 ”选项 启用 的 情况 下 该 消息 才 会 显示 在 当前 终端 中 。 在 绝 大 
多 数 发 布 版 中 ,“ 写 入 消息 ”选项 都 是 默认 启用 的 。 如 果 消 息 的 发 送 者 是 root 用 户 , 那么 不 管 “ 写 
人 消息 ”选项 是 否 启 用 ， 消 息 都 会 显示 出 来 。 


要 人 允许 写 人 消息 ， 可 以 使 用 : 






































$ mesg Y 


要 禁止 写 和 消息， 可 以 使 用 : 





$ mesgn 
让 我 们 写 一 个 给 指定 用 户 终端 发 送 消 息 的 脚本 : 


#/bin/bash 

# 文 件 名 : message_user.sh 

# 用 途 : 用 于 向 指定 用 户 的 终端 发 送 消息 的 脚本 
USERNAME=$1 











dqevices= `1s /dev/pts/* -1 | awk '{ print $3,$10 }' | grep $USERNAME | awk '{ print $2 }'. 
for dev in S$devices; 
do 
cat /dev/stdin > $dev 
done 


运行 脚本 : 











./message user.sh USERNAME < message.txt 


# 通 过 stdin 传 递 消息 ，USERNAME 作 为 参数 
输出 如 下 : 


$ cat message.txt 
A message to slynux. Happy Hacking! 
#./message user.sh slynux < message.txt 


# 因 为 消息 要 发 送 给 指定 的 用 户 ， 因 此 要 以 zxoot 用 户 身 份 运行 nessage_user.sh 
这 时 slynux 的 终端 就 会 接收 到 该 消息 。 
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9.4.3 工作 原理 


目录 /dev/pts 中 包含 着 与 每 一 位 系统 终端 中 登录 用 户 所 对 应 的 字符 设备 。 我 们 可 以 通过 查看 
1s -1 输出 设备 文件 的 属 主 来 得 知 谁 登入 了 哪个 终端 ,这 些 信息 可 以 用 awk 来 获得 ,然后 借助 grep 
提取 出 对 应 于 指定 用 户 的 行 。 用 户 名 作为 脚本 的 首 个 参数 被 存储 在 变量 USERNAME 中 。$devices 
中 包含 了 给 定 用 户 的 终端 列表 ， 该 列表 通过 for 循 环 来 进行 迭代 。/dev/stdin 包 含 传递 给 当前 进程 
的 标准 输入 数据 ， 这 些 数据 被 重 定向 到 对 应 的 终端 设备 (TTY )。 





























9. 5 采集 集 系 统 信息 


从 命令 行 中 收集 当前 系统 信息 对 于 记录 系统 数据 来 说 非常 重要 。 各 种 系统 信息 包括 主机 名 、 
内 核 版 本 、Linux 发 布 版 名 称 、CPU 信 息 、 内 存 信 息 、 磁 盘 分 区 信息 等 。 这 则 攻略 将 为 你 演示 在 
Linux 中 采集 系统 信息 的 各 种 途径 。 








实战 演练 
(1) 打印 当前 系统 的 主机 名 : 
$ hostname 
或 者 
$ uname -n 


(2) 打印 Linux 内 核 版 本 、 硬 件 架 构 等 详细 信 ， 





证 


$ uname -a 
(3) 打印 内 核发 行 版 本 : 
$ uname -r 
(4) 打印 主机 类 型 : 
$ uname -m 
(5) 打印 CPU 相 关 信 息 : 
$ cat /proc/cpuinfo 


获取 处 理 需 名 称 : 





$ cat /proc/cpuinfo | sed -n 5p 





9.6 使 用 proc 采 集 信 息 
cpuinfo 的 第 $ 行 包含 处 理 需 的 名 称 。 
(6) 打印 内 存 的 详细 信息 : 
$ cat /proc/meminfo 
打印 系统 可 用 内 存 总 量 : 


$ cat /proc/meminfo 
MemTotal : 
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| heada -1 
1026096 kB 
自 


[Eh 


(7) 列 出 系统 的 分 区 信 ， 





$ cat /proc/partitions 
或 者 


(8) 获取 系统 的 详细 信 ， 


$ lshw 





5) 


$ fdisk -1 # 如 果 没 有 输出 ， 切 换 到 root 用 户 执行 该 命令 
自 
# 建 议 以 coot 用 户 来 执行 
9.6 使 用 proc 采集 信息 
看 看 如 何 使 用 它 。 


实战 演练 





在 GNU/Linux 操 作 系 统 中 ，/proc 是 一 个 在 内 存 中 的 伪 文 件 系 统 (pseudo filesystem )。 它 的 引入 
文本 oO 


是 为 了 提供 一 个 可 以 从 用 户 空间 读 取 系 统 参数 的 接口 。 我们 能 够 从 中 获取 到 大 量 的 信息 。 下 面 来 

















三 | 


如 果 查 看 /proc，, 你 会 发 现 有 很 多 文件 和 目录 。 其 中 的 一 些 我 们 在 本 章 的 其 他 攻略 中 已 经 讲 
解 过 了 。 你 可 以 对 /proc 及 其 子 目录 下 的 文件 使 用 cat 来 获取 信息 。 所 有 内 容 都 是 易 读 的 格式 化 


以 Bash 为 例 ， 它 的 进程 ID 是 4295 (pgrep bash )， 那 么 就 会 有 一 个 对 应 的 目录 /proc/4295。 
口 environ: 包含 与 进程 相关 的 环境 
有 传递 给 该 进程 的 环境 变量 。 
口 exe: 十 一 


TIRE 三 月 


之 里 ob 





系统 中 每 一 个 运行 的 进程 在 /proc 中 都 有 一 个 对 应 的 目录 。 目 录 名 和 进程 ID 相同 。 
进程 对 应 的 目录 中 包含 了 大 量 有 关 进 程 的 信息 。/proc/PI 


D 中 一 些 重要 的 文件 如 下 所 示 。 
个 到 当前 进程 所 对 应 的 可 执行 文件 的 


J 


符号 


口 cwd: 是 一 个 到 进程 工作 目录 ( working directory ) 的 符号 链接 。 
链接 。 





使 用 cat /proc/4295/environ， 可 以 显示 所 
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$ readlink /proc/4295/exe 
/bin/bash 


口 £9: 包含 了 进程 所 使 用 的 文件 描述 符 。 


9.7 用 cron 进行 调度 


我 们 经 常会 需要 安排 脚本 在 某 个 时 间或 每 隔 一 段 时 间 来 运行 。GNU/Linux 系 统 包含 了 各 种 可 
用 于 任务 调度 的 工具 。cron 就 是 其 中 之 一 ， 它 通过 守护 进程 cron 使 得 任务 能 够 按照 固定 的 时 间 
间隔 在 系统 后 台 自 动 运 行 。cron 利 用 的 是 一 个 叫做 cron 表 的 文件 ， 这 个 文件 中 存储 了 需要 执行 
的 脚本 或 命令 的 调度 列表 以 及 执行 时 间 。 一 个 常见 的 用 法 是 设置 在 免费 时 段 (一 些 ISP 提 供 免费 
使 用 时 间 ， 通 常 是 在 午夜 )， 从 Iternet 上 进行 下 载 。 用 户 完全 不 需要 在 夜里 熬 红 双眼 等 待 下 载 。 
只 需要 编写 一 个 cron 条 目 , 然后 调度 下 载 即 可 。 你 也 可 以 安排 当 免 费时 段 结束 后 自动 断 开 Intemet 
连接 并 关机 。 































































































9.7.1 预备 知识 


所 有 的 GNU/Linux 发 布 版 默认 都 包含 了 cron 调 度 工 具 。 只 要 在 cron 表 中 写 人 条 上 日 ， 对 应 的 
命令 就 会 在 指定 的 时 间 执 行 。crontab 命 令 用 来 添加 作业 (job )。cron 表 不 过 是 一 个 简单 的 文本 
文件 而 已 ， 每 位 用 户 都 有 自己 的 副本 。 























9.7.2 ”实战 演练 


要 想 进 行 任务 调度 ， 我 们 得 知道 cron 表 的 格式 。 一 项 cron 作 业 指定 了 需要 执行 的 脚本 或 命 
令 的 路 径 以 及 执行 时 间 。 


(1) 创建 一 项 cron 人 作业， 在 每 天 中 每 小 时 的 第 2 分 钟 执行 脚本 test.sh: 
02 * * * * /home/slynux/test.sh 


(2) 在 每 天 的 第 ;5、6、7 小 时 执行 脚本 : 








00 5,6,7 * * /home/slynux/test.sh 
(3) 在 周 日 的 每 个 小 时 执行 脚本 script.sh: 
00 */12 * * 0 /home/slynux/script.sh 


(4) 在 每 天 凌晨 2 点 关闭 计算 机 : 





00 02 * * * /sbin/shutdown -h 
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(5) 现在 ， 让 我 们 看 看 如 何 调度 一 项 cron 作 业 。 利 用 crontab 命 令 进 行 调度 的 方法 有 很 
多 种 。 
使 用 选项 -e 来 编辑 cron 表 : 


$ crontab -e 
02 02 * * * /home/slynux/script.sh 


输入 crontab -e 后 ,会 打开 默认 的 文本 编辑 器 (通常 是 vi ) 供用 户 输入 cron 作 业 
并 保存 。 该 cron 作 业 将 会 在 指定 的 时 间 被 调度 执行 。 


(6) 如 果 我 们 在 脚本 中 调用 crontab 进 行 任务 调度 ,那么 有 男 外 两 种 方法 可 供 使 用 。 
中 创建 一 个 文本 文件 ( 例如 task.cron )， 并 写 人 cron 作 业 。 将 文件 名 作为 命令 参数 ， 


运行 crontab: 

















$ crontab task.cron 


名 在 行内 (inline ) 指定 cron 作 业 ， 而 无 需 创建 单独 的 文件 。 例 如 : 





crontab<<EOF 
02 * * * * /home/slynux/script.sh 
EOF 


cron 作 业 需 要 写 在 crontab<<EOF 和 EOF 之 间 。 


9.7.3 工作 原理 
czon 表 中 的 每 一 个 条 目 都 由 6 部 分 组 成 ， 并 按照 下 列 顺序 排列 : 





口 分 钟 (0~ 59 ) 

口 小 时 (0~23) 

口 天 (1~31) 

口 月份 (1~12) 

口 工作 日 (0~6) 

口 命令 (在 指定 时 间 执 行 的 脚本 或 命令 ) 


前 5 部 分 指定 了 开始 执行 某 个 命令 实例 的 时 间 。 还 有 其 他 一 些 选 项 也 可 用 来 指定 调度 时 间 。 





星 号 (* ) 指定 命令 应 该 在 每 个 时 间 段 执行 。 也 就 是 说 ， 如 果 * 是 写 在 cron 作 业 中 的 小 时 字 
段 中 , 那么 命令 就 会 每 小 时 执行 一 次 。 与 此 类 似 ， 如 果 你 希望 在 某 个 特定 时 段 执行 命令 , 那么 就 
在 对 应 的 时 间 字 段 中 指定 时 段 ， 并 用 逗号 分 隔 〈 例如 要 在 5 分 钟 和 10 分 钟 时 运行 命令 ， 那 就 在 分 
钟 字段 中 输入 "5,10" )。 还 有 男 一 个 不 错 的 选项 可 以 让 我 们 以 特定 的 时 间 间 隔 运 行 命令 。 在 分 钟 
字段 使 用 */5， 可 以 每 5 分 钟 运行 一 次 命令 。 这 个 技巧 可 以 用 在 任何 时 间 字 d 段 。 一 个 cron 表 条 目 
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是 由 一 项 或 多 项 cron 作 业 组 成 的 。cron 表 条 目 中 的 每 一 行 都 是 一 项 作业 。 

执行 czon 作 业 所 使 用 的 权限 同 执行 czontab 命 令 所 使 用 的 权限 相同 。 如 果 你 需要 执行 要 求 
更 高 权限 的 命令 ， 例 如 关闭 计算 机 ， 那 么 就 要 以 root 用 户 身 份 执行 crontab。 

在 cron 作 业 中 指定 的 命令 需要 使 用 完整 路 径 。 这 是 因为 执行 cron 作 业 时 的 环境 与 终端 所 使 
用 的 环境 不 同 ， 环 境 变量 PamH 可 能 都 没有 设置 。 如 果 命 令 运行 时 需要 设置 某 些 环 境 变量 ， 就 应 
该 明确 地 进行 设 定 。 




















9.7.4 补充 内 容 

crontab 命 令 还 包括 其 他 选项 。 让 我 们 看 看 其 中 一 部 分 。 

1. 指定 环境 变量 

很 多 命令 需要 正确 的 设置 环境 变量 才能 够 运行 。 我 们 可 以 在 用 户 的 cron 表 中 插入 一 行 变 量 
赋值 语句 来 设置 环境 变量 。 

例如 ,如果 你 使 用 的 是 代理 服务 器 连接 互联 网 ,要 调度 某 个 需要 使 用 互联 网 的 命令 ,就 得 设 
置 HTTP 代 理 环境 变量 httpb_proxvy， 可 以 用 下 面 的 方法 来 完成 : 

















crontab<<EOF 

http proxy=http://192.168.0.3:3128 
00 * * * * /home/slynux/download.sh 
EOF 


2. 在 系统 启动 时 运行 命令 


有 时 候 需 要 在 系统 启动 时 运行 特定 的 命令 。 实 现 这 一 需求 的 方法 有 很 多 ，cron 便 是 其 中 之 
一 。( 其 他 一 些 方法 是 将 命令 添加 到 /etc/re.d 中 ,但 这 并 不 能 保证 在 所 有 的 发 布 版 中 都 行 得 通 。) 


要 在 启动 时 运行 命令 ， 请 将 下 面 一 行 加 入 crontab: 








oO 


@reboot command 
这 样 就 会 以 你 所 具有 的 用 户 身份 来 运行 指定 的 命令 。 如 果 需 要 以 root 用 户 的 身份 运行 命令 ,需要 
编辑 root 用 户 的 crontab。 

3. 查看 cron 表 

我 们 可 以 用 选项 -1 列 出 cron 表 中 现 有 的 内 容 : 


$ crontab -1 
02 05 * * * /home/user/disklog.sh 








9.8 从 Bash 中 读 写 MySQL 数据 库 283 





crontab -1 会 列 出 当前 用 户 cron 表 中 的 已 有 条 目 。 
我 们 也 可 以 通过 选项 -u 来 查看 其 他 用 户 的 cron 表 : 


$ crontab -1 -u slynux 
09 10 * * * /home/slynux/test.sh 


当 使 用 选项 -u 时 ， 你 必须 作为 root 用 户 以 获取 更 高 的 权限 。 
4. 删除 cron 表 

可 以 使 用 选项 -r 删 除 当 前 用 户 的 cron 表 : 

$ crontab -r 

要 删除 其 他 用 户 的 cron 表 ， 可 以 使 用 : 


# crontab -u slynux -r 


这 和 需要 以 root 用 户 身 份 以 获得 更 高 的 权限 。 





9.8 从 Bash 中 读 写 MySQL 数据 库 


MySQL 是 一 款 应 用 广泛 的 数据 库 管 理 系统 。 以 PHP、Python、C++ 等 语言 编写 的 应 用 程序 通 
常 使 用 它 作 为 存储 系统 。 从 shell 脚 本 中 访问 并 处 理 MySQL 数 据 库 也 很 有 意思 。 我 们 可 以 编写 脚本 
将 文本 文件 或 CSV (Comma Separated Value ， 逗 号 分 隔 值 文件 ) 的 内 容 写 入 数据 表 ， 与 MySQL 
进行 交互 来 读 取 、 处 理 数据 。 例 如 ， 可 以 从 shell 脚 本 中 执行 查询 语句 来 读 取 存储 在 留言 板 程序 的 
数据 库 中 的 所 有 电子 邮件 地 址 。 在 这 则 攻略 中 ， 我 们 会 看 到 如 何 从 Bash 中 读 写 MySQL 数 据 库 。 
假设 现在 有 以 下 问题 。 


我 有 一 个 包含 学 生 详细 信息 的 CSV 文 件 。 我 需要 将 文件 的 内 容 搬 入 到 一 个 数据 表 中 。 要 保证 
为 每 一 个 系 生 成 一 个 单独 的 排名 列表 。 














9.8.1 预备 知识 


要 处 理 MySQL 数 据 库 ， 系 统 中 必须 安装 mysql-server 和 mysql-client 软 件 包 。Linux 发 布 版 中 默 
认 并 没有 包含 这 些 工 具 。 由 于 MySQL 要 使 用 用 户 名 和 密码 进行 认证 ， 在 安装 MySQL 服 务 器 时 还 
得 设置 用 户 名 和 密码 。 











9.8.2 ”实战 演练 
前 面 提出 的 问题 可 以 用 sort 、avk 等 工具 解决 ,或 者 用 一 个 SQL 数 据 库 的 数据 表 也 可 以 搞定 。 全 
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我 们 接 下 来 要 编写 3 个 脚本 ， 分 别 用 于 创建 数据 库 及 数据 表 、 向 数据 表 中 插入 学 生 数据 、 从 数据 
表 中 读 取 并 显示 处 理 过 的 数据 。 

创建 数据 库 及 数据 表 的 脚本 如 下 : 

#!/bin/bash 


# 文 件 名 : create_db.sh 
# 用 途 : 创建 MySQL 数 据 库 和 数据 表 








USER=" use " 
PASS= "USeI" 


mysql -u SUSER -PSPASS <<EOF 2> /dev/null 
CREATE DATABASE students; 
EOF 




















[ $? -eq 0 ] && echo Created DB || echo DB already exist 
mysql -u SUSER -pS$PASS students <<EOF 2> /dev/null 
CREATE TABLE students!( 


Ld “ty 

















name varchar (100), 
mark int, 

dept varchar (4) 

) 

EOF 





[ $? -eq 0 ] && echo Created table students || echo Table students already exist 


mysql -u SUSER -pS$PASS students <<EOF 
DELETE FROM students; 
EOF 


将 数据 插入 数据 表 的 脚本 如 下 : 




















!/bin/bash 
文件 名 : write_to_db.sh 
用 途 : 从 CSV 中 读 取 数据 并 写 入 MySQLdb 





USER="uUuSer" 
PASS="UuSer" 


if [ $# -ne 1 ]; 
then 
echo $0 DATAFILE 
echo 








exit 2 
下 


data=$1 


9.8 从 Bash 中 读 写 MySQL 数据 库 
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while read line; 


do 


oldIFS=S$IFS 
IFS=, 

values= ($line) 
values[1]="\"‘echo S${values[1]} | tr ' ' '#' 
values[3]="\" echo ${values[3]} \"" 


query=‘echo S${values[@]} | tr ' #' ', 
IFS=$oldIFS 


mysql -u SUS] 


INS] 
EOF 





ERT INTO students VALU 





done< $data 
echo Wrote data into DB 


查询 数据 库 的 脚本 如 下 : 


#!/bin/bash 
# 文 件 名 : read_db.sh 
# 用 途 : 从 数据 库 中 读 取 数据 


USE 





R="USer" 


PASS="user" 


SEL] 











ECT DISTINCT dept FROM 





EOF 


下 合共 
do 


d in $depts; 


echo Department : $d 


result=" ‘mysql -u SUS 


SET 
SEL] 





所 





@i:=0; 








EOF 


i 


echo "$result" 


echo 


done 


ER -pS$PASS students <<EOF 





ES ($query); 


students; 


ER -pS$SPASS students <<EOF 


ts="mysql -u $USER -pS$PASS students <<EOF | tail -mn +2 


ECT @i:=@i+1 as rank,name,mark FROM students WHERE dept="$d" ORDER BY mark D 








ESC; 
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作为 输入 的 CSV 文 件 (studentdata.csv ) 中 的 数据 如 下 : 


1 Navin M,98,CS 
2,Kavya N,70,cCs 
3,Nawaz 0O,80,cs 
4,Hari S,80,EC 
5,Alex M,50,EC 
6,Neenu J,70,EC 
7,Bob A,30,EC 

8,Anu M,90,AE 

9,Sruthi, 89,AE 
10,Andrew, 89,AE 


按照 以 下 顺序 执行 脚本 : 


$ ./create db.sh 
Created DB 
Created table students 


$ ./write to db.sh studentdat.csv 
Wrote data into DB 


$ ./read db.sh 
Department : CS 
rank name mark 
1 Navin M 98 

2 Nawaz O 80 

3 Kavya N 70 


Department : EC 
rank name mark 
1 Hari S 80 

2 Neenu J 70 

3 Alex M 50 

4 Bob 人 30 


Department : AE 
rank name mark 
1 Anu M 90 

2 Sruthi 89 

3 Andrew 89 


9.8.3 工作 原理 


我 们 现在 来 逐个 讲解 上 面 的 脚本 。 第 一 个 脚本 create_db.sh 用 来 创建 数据 库 students， 并 在 其 
中 创建 数据 表 students。 我 们 需要 MySQL 的 用 户 名 和 密码 来 访问 或 修改 数据 库 中 的 内 容 。 变 量 
USER 和 PASS 用 来 存储 用 户 名 和 密码 。mysql 命 令 用 于 对 MySQL 进 行 操作 。 该 命令 可 以 用 -u 指 定 
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用 户 名 ， 用 -pPASSWORD 指 定 密码 ， 其 他 命令 参数 是 数据 库 名 。 如 果 将 数据 库 名 作为 mysql 命 令 
的 参数 ， 那 么 就 将 使 用 该 数据 库 ， 否 则 就 必须 用 use database_name 明 确 地 为 SQL 查 询 语句 指 
明 使 用 哪 一 个 数据 库 进 行 查询 。mysqgl 命 令 通 过 标准 输入 ( stdin ) 接受 查询 。 通 过 stdin 提 供 
多 行 输入 的 简便 方法 是 使 用 <<EoF。 出 现在 <<EoF 和 EoF 之 间 的 文本 被 作为 mysdl 的 标准 输入 。 
在 CREATE DATABASE 语 句 中 ,为 了 避免 显示 错误 信息 ,我 们 将 stderz 重 定向 到 /devnull。 同 样 ， 
在 创建 数据 表 时 ， 我 们 也 将 stdqerz 重 定向 到 /dev/null， 以 忽略 可 能 出 现 的 任何 错误 。 然 后 用 退 
出 状态 变量 $? 来 检查 mysql 命 令 的 退出 状态 , 以 获知 是 否 已 经 存在 同名 的 数据 库 或 数据 表 。 如 果 
已 经 存在 ， 则 会 显示 出 一 条 提示 信息 ; 否则 ， 就 进行 创建 。 


接 下 来 的 脚本 write_to_db.sh 接 受 包含 学 生 数 据 的 CSV 文 件 名 。 我 们 用 while 循 环 读 取 CSV 文 
件 的 每 一 行 , 因此 在 每 次 迭代 中 都 会 接收 到 一 行 以 逗号 分 隔 的 数值 。 然后 需要 将 行内 的 数值 放 入 
SQL 查询 语句 中 。 要 实现 这 个 目的 ， 最 简单 的 方法 是 用 数组 存储 CSV 文 件 行 中 的 数据 项 。 我 们 知 
道 数组 赋值 的 形式 为 array= (vall val2 val3) ， 其 中 内 部 字段 分 隔 符 (IFS ) 是 空格 。 文 本 行 
用 逗号 分 隔 数值 ， 因 此 只 需要 将 IFS 修 改 成 逗号 (IFS=，)， 就 可 以 轻松 地 赋值 给 数组 。 文 本 行 中 
以 逗号 分 隔 的 数据 项 分 别 是 ia 、name 、mark 和 department。id 和 mark 是 整数 ， 而 name 和 
department 是 字符 串 (字符 串 必须 进行 引用 )。name 中 也 可 以 包含 空格 。 这 样 一 来 就 和 IFS 产 生 
了 冲突 。 因 此 我 们 应 该 将 name 中 的 空格 替换 成 其 他 字符 (# )， 在 构建 查询 语句 时 再 替换 回来 。 
为 了 引用 字符 串 ， 数 组 中 的 值 要 加 上 \" 作为 前 缀 和 后 级。tr 用 来 将 name 中 的 空格 蔡 换 成 #。 最 
后 通过 将 空格 替换 成 逼 号， 将 # 替换 成 空格 来 构造 出 查询 语句 并 进行 查询 。 


第 三 个 脚本 read_db.sh 用 来 查找 各 系 并 打印 出 每 个 系 的 学 生 排 名 列表 。 第 一 个 查询 用 来 找 出 
各 系 的 名 称 。 我 们 用 一 个 while 循 环 对 每 个 系 进行 迭代 ,然后 进行 查询 并 按照 成 绩 从 高 到 低 的 顺 
序 显示 学 生 的 详细 信息 。sET @i :=0 是 一 个 SQL 构件 ( SQL construct )， 用 来 设置 变量 i=0。 在 每 
一 行 中 ， 变 量 i 都 会 增加 并 作为 学 生 排名 来 显示 。 






















































































9.9 用户 管 理 脚本 


GNU/Linux 是 一 个 多 用 户 操 作 系 统 ， 多 个 用 户 可 以 同时 登录 并 执行 多 种 操作 。 有 一 些 管理 任 
务 会 涉及 用 户 管理 ， 这 包括 为 用 户 设置 默认 shell、 禁 用 某 个 账户 、 禁 用 某 个 shell 账 户 、 添 加 新 用 
户 、 删 除 用户 、 设 置 密码 、 设 置 账 户 有 效 期 等 。 这 则 攻略 旨 在 编写 一 个 可 以 处 理 此 类 任务 的 用 户 
管理 工具 。 



































9.9.1 实战 演练 
让 我 们 看 看 这 个 用 户 管理 脚本 : 


#!/bin/bash 
# 文 件 名 : user_adm.sh 
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# 用 途 : 用 户 管理 工具 


function usage() 
{ 
echo Usage: 
echo Add a new user 
echo $0 -adduser username password 
echo 
echo Remove an existing user 
echo $0 -deluser username 
echo 
echo Set the default shell for the user 
echo $0 -shell username SHELL PATH 
echo 
echo Suspend a user account 
echo $0 -disable username 
echo 





echo Enable a suspended user account 
echo $0 -enable username 

echo 

echo Set expiry date for user account 
echo $0 -expiry DATE 

echo 

echo Change password for user account 
echo $0 -passwd username 

echo 

echo Create a new user group 

echo $0 -newgroup groupname 

echo 

echo Remove an existing user group 
echo $0 -delgroup groupname 

echo 

echo Add a user to a group 

echo $0 -addgroup username groupname 
echo 

echo Show details about a user 

echo $0 -details username 

echo 

echo Show usage 

echo $0 -usage 

echo 


exit 


if [ SUID -ne 0 ]; 
then 
echo Run $0 as root. 
exit 2 
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fi 


case $1 in 


-adduser) [ S# -ne 3 ] && usage ; useradd $2 -p $3 -m ;; 
-deluser) [ S# -ne 2 ] && usage ; deluser $2 --remove-all-files;; 
-shell) [ S$S# -ne 3 ] && usage ; chsh $2 -s $3 ;; 
-disable) [ S# -ne 2 ] && usage ; usermod -L $2 );; 
-enable) [ S# -ne 2 ] && usage ; usermod -U $2 ); 
-expiry) [ S$# -ne 3 ] && usage ; chage $2 -E $3 );; 
-passwd) [ S$S# -ne 2 ] && usage ; passwd $2 );; 
-newgroup) [ S$# -ne 2 ] && usage ; addgroup $2 ，;; 
-delgroup) [ $# -ne 2 ] && usage ; delgroup $2 ;; 
-addgroup) [ S# -ne 3 ] && usage ; addgroup $2 $3 ;; 
-details) [ S# -ne 2 ] && usage ; finger $2 ; chage -1 $2 );; 
-USage) usage ;; 
*) usage }} 

esac 

输出 如 下 : 

# ./user adm.sh -details test 

Login: test Name: 

Directory: /home/test Shell: /bin/sh 

Last login Tue Dec 21 00:07 (IST) on pts/1 from localhost 

No mail. 

No Plan. 

Last password change : Dec 20, 2010 

Password expires : never 

Password inactive : never 

Account expires : Oct 10, 2010 

Minimum number of days between password change -| 

Maximum number of days between password change : 99999 


Number of days of warning before password expires :7 


9.9.2 工作 原理 


脚本 user_ adm.sh 可 以 用 来 执行 多 种 用 户 管理 任务 。 你 可 以 参考 usage () 中 的 内 容 来 学 习 这 个 
脚本 的 用 法 。 当 用 户 给 出 的 参数 不 正确 或 使 用 -usage 选 项 时 ， 函 数 usage () 用 来 显示 脚本 不 同 
选项 的 使 用 方法 。case 语 句 用 来 匹配 命令 参数 ， 并 根据 参数 执行 对 应 的 命令 。 脚 本 user_adm.sh 
合法 的 命令 选项 是 : -adduser, -deluser, -shell, -disable, -enable, expiry, -passwd， 
-newgroup，-delgroup，-addqgroup，-dqetails 和 -usage。 如 果 匹 配 了 *) 分 支 ， 那 就 意味 
着 用 户 输入 了 错误 的 选项 ， 因 此 要 调用 usage () 。 对 于 每 一 个 匹配 分 文 ， 使 用 [ $# -ne 3 ] && 
usage。 它 用 来 检测 参数 个 数 。 如 果 命 令 参 数 个 数 不 等 于 要 求 的 数量 ， 则 调用 函数 usage () 并 退 
出 脚本 。 要 运行 用 户 管理 命令 ,需要 以 超级 用 户 身 份 执行 脚本 。 因 此 要 检查 用 户 ID 是 否 为 0 ( root 
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用 户 的 用 户 ID 是 0 )。 如 果 用 户 ID 非 0， 则 表明 脚本 不 是 以 root 用 户 身 份 执行 的 ,因此 显示 出 要 求 以 
root 用 户 身份 运行 脚本 的 提示 消息 并 退出 。 


下 面 来 逐个 讲解 每 个 选项 。 








口 -useradd 


useradd 命 令 可 以 用 来 创建 新 用 户 。 命 令 语 法 如 下 : 





useradd USER -p PASSWORD 


口 选项 -m 用 来 创建 home 目 录 。 也 可 以 用 选项 -c FULLNAME 提 供用 户 的 全 名 。 


D -deluser 


deluser 命 令 用 来 删除 用 户 。 命 令 语法 如 下 : 








deluser USER 


口 --remove-all-files 用 来 删除 与 用 户 相 关 的 所 有 文件 ， 包 括 home 目 录 。 
口 -shell 


chsh 命 令 用 来 修改 用 户 的 默认 shell。 命 令 语法 如 下 : 








chsh USER -s SHELL 


口 -disable 和 -enable 


usetrmod 命 令 用 来 处 理 和 用 户 账户 相关 的 大 二 属性 信息 。 usermod -L USER 和 usermod 
-U _ USER 分别 用 来 锁定 和 解锁 用 户 账户 。 











口 -expiry 
chage 命 令 用 来 处 理 用 户 账户 的 过 期 信息 。 命 令 语 法 如 下 : 
Chage -E DATE 
其 他 选项 如 下 : 


@ -m MIN_DAYS (将 更 改 密码 的 最 小 天 数 修改 成 MIN_DAYs ); 
@ -M MAX_DAYS (设置 密码 有 效 的 最 大 天 数 ); 
@ -W -WARN_DAYS (设置 在 前 几 天 提醒 需要 更 改 密码 )。 











D -passwd 


passwd 命 令 用 来 更 改 用 户 密 码 。 命 令 语法 如 下 : 





passwd USER 
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命令 会 提示 输入 新 的 密码。 





口 -newgroup 和 addgroup 
addgroup 命 令 会 为 系统 添加 一 个 新 的 用 户 组 。 命 令 语法 如 下 : 
addgroup GROUP 
要 将 已 有 的 用 户 添加 到 一 个 组 ， 可 以 使 用 : 


addgroup USER GROUP 
-delgroup 


delgroup 命 令 会 删除 一 个 用 户 组 。 命令 语法 如 下 : 
delgroup GROUP 
DQ -details 


figer USER 命 令 会 显示 用 户 信息 , 这 包括 用 户 的 home 目 录 、 上 一 次 登录 的 时 间 、 默 认 shell 
等 。chage -1 命令 会 显示 用 户 账户 的 过 期 信息 。 





9.10 图 像 文件 的 缩放 及 格式 转换 


我 们 大 家 都 会 使 用 数码 相机 ， 也 会 从 网 上 绪 取 数码 上 照片。 如果 需 要 处 理 大 量 图 像 文件 , 我 们 
可 以 轻松 地 用 脚本 进行 批量 处 理 。 这 通常 会 涉及 到 的 任务 是 调整 照片 的 大 小 , 还 有 转换 图 像 格 式 
( 例如， 将 JPEG 格 式 转换 成 PNG 格 式 )。 当 从 数码 相机 中 取 到 照片 时 ， 大 分 辨 率 的 图 片 体积 都 比 
较 大 , 我 们 可 能 需要 减少 图 片 的 大 小 ,以 便于 存储 并 通过 电子 邮件 发 送 。 因 此 就 需要 调整 图 片 的 
大 小 来 降低 分 辨 率 。 这 则 攻略 将 讨论 如 何 用 脚本 管理 图 片 。 

















9.10.1 预备 知识 


我 们 要 用 到 convert 命 令 ， 它 来 自 Imagemagick 软 件 包 ， 该 软件 包 中 包含 了 大 量 出 色 的 图 像 
处 理工 具 ， 拥 有 各 类 选项 的 丰富 ， 能 够 处 理 多 种 图 像 格式 。 大 多 数 GNU/Linux 发 布 版 中 并 没有 预 
装 Imagemagick。 你 得 自己 手动 安装 。 更 多 的 信息 请 访问 www.imagemagick.org。 





9.10.2 ”实战 演练 
将 一 种 图 像 格式 转换 为 男 一 种 图 像 格 式 : 


$ convert INPUT FILE OUTPUT FILE 


例如 : 
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$ convert filel.png file2.png 
我 们 可 以 通过 指定 缩放 比 或 输出 图 像 的 宽度 和 高 度 来 调整 图 像 。 
指定 wIDTH ( 宽度 ) 或 HEIGHT (高 度 ) 来 缩放 图 像 : 




















$ convert image.png -resize WIDTHxHEIGHT image.png 
例如 : 


$ convert image.png -resize 1024x768 image.png 


必须 提供 wIDTH 或 HEIGHT， 这 样 才 能 够 自动 计算 其 他 数值 ， 以 便 在 保留 图 像 比 例 的 同时 进 
行 缩放 。 








$ convert image.png -resize WIDTHx image.png 
例如 : 

$ convert image.png -resize 1024x image.png 

指定 百分比 缩放 图 像 : 

$ convert image.png -resize "50%" image.png 

让 我 们 看 一 个 用 于 图 像 管 理 的 脚本 : 


#!/bin/bash 
# 文 件 名 : image_help.sh 
# 用 途 :图 像 管 理 脚本 














if [ S$S# -ne 4 -a S$# -ne 6 -a S$# -ne 8 ]; 
then 
echo Incorrect number of arguments 
exit 2 


case $1 in 

-source) shift; source dir=$1 ; shift ;; 
-scale) shift; scale=$1 ; shift ;; 
-percent) shift; percent=$1 ; shift ;; 
-dest) shift ; dest dir=$1 ; shift ;; 
-ext) shift ; ext=$1 ; shift ;; 

*) echo Wrong parameters; exit 2 ;; 
esac; 


done 
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for 1m in “echo Ssouree .dir/*™ 3; 
do 
source_file=$img 


if [[ -n $ext ]]; 
then 
dest_file=${img%®%.*}.S$ext 
else 
dest_file=$img 
£1i 
if [[ -ngSqest qir ]]; 
then 


dest_file=${dest_ file##*/} 
dest_file="$dest_dir/sdest_file" 


于 

if [[ -n $scale ]]; 

then 
PARAM="-resize S$scale" 

elif [[ -n S$percent ]]; then 
PARAM="-resize Spercent%" 

£1i 


echo Processing file : $source file 
Convert S$source file S$PARAM Sdest_file 


done 


下 面 是 输出 样 例 ， 将 目录 sample_dir 中 的 图 像 调 整 到 原来 的 20%: 

















$ ./image help.sh -source sample dir -percent 20% 
Processing file :sample/IMG 4455.JPG 
Processing file :sample/IMG 4456.JPG 
Processing file :sample/IMG 4457.JPG 
Processing file :sample/IMG 4458.JPG 


将 图 像 宽度 调整 到 1024 像 素 : 

$ ./image help.sh -source sample dir -scale 1024x 
把 -ext png 加 入 上 而 的 命令 ,使 文件 格式 转换 成 PNG。 
将 文件 缩放 或 转换 到 指定 的 目录 : 


$ ./image help.sh -source sample -Scale 50% -ext png -dest newdir 


# newdir 作 为 目的 目录 
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9.10.3 工作 原理 


上 面 的 脚本 image_ help.sh 可 以 接受 多 个 命令 行 参数 ， 例 如 -source、-percent、-scale、 
-ext 和 -dest 等 。 每 个 选项 的 简短 描述 如 下 。 


口 -source 用 于 指定 图 像 源 目 录 。 

口 -percent 用 于 指定 缩放 比例 ，-scale 用 于 指定 缩放 宽度 与 高 度 。 

口 -percent 与 -scale 不 能 同时 出 现 ， 只 能 使 用 其 中 之 一 。 

口 -ext 用 于 指定 目标 文件 格式 。-ext 是 一 个 可 选 的 选项 。 如 果 没 有 指定 ,那么 不 执行 格式 
转换 。 

口 -dest 为 缩放 或 转换 格式 后 的 文件 指定 目标 目录 。 该 选项 也 是 可 选 的。 如 果 没 有 指定 , 目 
标 目 录 则 和 源 目录 相同 。 脚 本 的 第 一 步 就 是 检查 命令 行 参 数 的 数量 是 否 正 确 ， 可 以 出 现 
的 参数 数量 分 别 是 4、6 或 8。 


借助 while 循 环 和 case 语 句 ， 我 们 将 命令 行 参数 解析 到 对 应 的 变量 。s$# 是 一 个 特殊 的 变量 ， 
它 可 以 返回 参数 的 数量 。shift 命 令 每 执行 一 次 ， 就 将 命令 行 参数 向 左 移动 一 个 位 置 ， 这 样 我 们 
就 不 需要 使 用 变量 $1、$2、$3 等 ， 而 只 用 一 个 $1 就 可 以 对 命令 参数 逐个 访问 了 。case 语 句 用 来 
匹配 $1 的 值 ， 就 像 C 语 言 中 的 switch 语 名 一 样 。 如 果 匹 配 了 某 个 case 分 文 ， 就 执行 对 应 的 语句 。 
每 一 个 case 分 支 都 以 ;; 作 为 结尾 。 一 旦 将 所 有 的 参数 都 解析 到 变量 percent 、scale、 
source_qdir、ext 和 dest_qdir 中 ,就 用 for 循 环 对 源 目录 中 的 每 一 个 文件 进行 迭代 ， 并 执行 对 应 
的 转换 操作 。 


如 果 变 量 ext 已 定义 (也 就 是 说 -ext 作 为 命令 参数 出 现 )， 就 将 目标 文件 的 扩展 名 从 
source_file.extension 更 改 为 source_file.$ext。 接 下 来 检查 是 否 提 供 了 -dest 选 项 。 如 果 指 定 了 目标 
目录 ,， 则 使 用 文件 名 切片 将 源 路 径 中 的 目录 替换 成 目标 目录 ， 从 而 形成 目标 文件 路 径 。 随 后 构造 
出 convert 命 令 的 参数 用 以 执行 缩放 ( -resize widthx 或 -resize perc% J 参数 构造 完 
毕 之 后 ， 用 对 应 的 参数 执行 convert 命 令 。 































































































9.10.4 “参考 
2.12 节 讲解 了 如 何 提取 部 分 文件 名 。 


9.11 从 终端 截图 


截图 是 男 一 种 常见 的 计算 机 用 户 日 常 操作 。 对 于 维护 GUI 应 用 以 及 自动 化 管理 的 系统 管理 员 
而 言 ， 这 种 操作 更 为 重要 。 当 特定 事件 出 现时 ， 关 键 就 是 要 抓 取 截 图 ， 以 便 知 道 GUI 应 用 到 底 出 
了 什么 


























所 
Ho 


hl 


9.12 ”管理 多 个 终端 295 





9.11.1 预备 知识 


我 们 要 使 用 一 个 来 自 ImageMagick 软 件 包 的 工具 ， 该 工具 包 在 上 一 个 攻略 中 已 经 有 所 涉及 。 
请 使 用 软件 包 管 理 器 自行 安装 。 





9.11.2 ”实战 演练 
下 面 我 们 使 用 ImageMagick 中 的 import 工 具 进 行 截图 。 
(1) 取 整 个 屏幕 : 
$ import -window root screenshot .png 
(2) 手动 选择 部 分 区 域 进行 抓 取 : 
$ import screenshot .png 
(3) 抓 取 特定 窗口 : 


$ import -window window id screenshot .png 


使 用 命令 xwininfo， 点 击 需 要 抓 取 截图 的 窗口 来 获得 window_id。 然 后 将 
window_ i d 传 递 给 import 命 令 的 -window 选 项 。 





9.12 ”管理 多 个 终端 

如 果 你 频繁 地 使 用 shell， 大 概 会 注意 到 有 时 候 需 要 同时 访问 多 个 终端 。 如 果 你 使 用 的 是 如 
Konsole 这 类 图 形 化 终端 模拟 器 ， 就 得 借助 多 个 标签 (tab ) 才能 满足 这 种 需求 。 

但 是 如 果 没 有 图 形 化 终端 模拟 器 该 怎么 办 呢 ? 或 者 说 登录 到 远程 主机 ， 和 希望 使 用 多 个 shell， 
又 该 怎么 办 呢 ? 在 后 一 种 情况 中 ， 打 开 多 个 ssh 连 接 基 本 上 只 能 浪费 网 络 带宽 ， 拖 慢 运 行 速度 而 
已 。 接 下 来 我 们 会 看 到 如 何在 避免 这 些 问 题 的 同时 获得 多 个 shell。 


























9.12.1 预备 知识 


要 实现 这 一 点 ， 需 要 使 用 一 个 叫做 GNU screen 的 工具 。 如 果 你 使 用 的 发 布 版 中 没有 预 装 
scrfeen， 请 使 用 软件 包 管理 需 自 行 安装 。 





9.12.2 ”实战 演练 
口 创建 新 的 screen 窗 口 : 从 shell 中 运行 Screen 来 创建 一 个 新 的 screen。 你 会 看 到 一 条 欢迎 消 9 
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息 以 及 一 些 该 软件 的 相关 信息 。 按 空格 键 或 回 车 键 开 始 。 接 着 会 获得 一 个 新 的 shell 用 以 输 
入 命令 。 要 创建 新 窗口 ( 基本 上 相当 于 一 个 


查看 已 打开 的 窗口 列表 : 在 运行 screen 时 ， 如 果 要 查看 所 有 打开 窗口 ， 使 用 Ctrl+A+"。 
在 窗口 之 间 切 换 : 





新 shell )， 使 用 CtrlI+A+C ( 区 分 大 小 写 )。 








我 们 通常 需要 以 下 个 /前 

















个 ( next/previous ) 的 方式 在 打开 的 窗口 之 





间 进 行 切换 。 可 以 使 用 Ctrl+A 和 CtrlHN 切 换 到 下 一 个 窗口 ， 使 用 Ctrl+A 和 Ctrl+P 切 换 到 前 


一 个 窗口 。 


关联 与 脱离 screen: screen 具 备 一 个 有 用 的 特性 , 能 够 让 你 保持 、 载 人 screen 会 话 , 用 screen 
的 术语 来 说 , 叫做 脱离 ( detaching ) 与 关联 (attaching )。 使 用 CtrlI+A 和 CtrlHD 脱 离 当 前 screen 
会 话 。 要 关联 到 一 个 已 有 的 screen 会 话 ， 可 以 使 用 : 


Screen -r -d 








该 命令 告诉 screen 关 联 到 上 一 个 screen 会 话 。 如 果 已 脱离 的 会 话 不 止 一 个 ，screen 会 用 列表 
输出 会 话 ， 然 后 可 以 使 用 下 述 命令 : 


Screen -r -d PID 














这 里 ，PID 是 你 想 关 联 到 的 screen 会 话 的 PID。 
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E 子 出 版 的 时 代 已 经 来 临 。 在 许多 出 版 界 同行 还 在 犹 。 ”图 灵 社 区 进一步 把 传统 出 版 流程 与 电子 书 出 版 业务 
洛 簿 香 的 时 候 ， 图 灵 社 区 已 经 采取 实际 行动 拥抱 这 个 。 ”紧密 结合 ， 目 前 已 实现 作 译 者 网 上 交 稿 、 编 辑 网 上 
出 版 业 巨变 。 作 为 国内 第 一 家 发 售 电 子 图 书 的 IT 类 出 f 稿 、 按 章 发 布 的 电子 出 版 模式 。 这 种 新 的 出 版 模 
版 商 ， 图 灵 社 区 目前 为 读者 提供 两 种 DRM-free 的 阅读 式 ， 我 们 称 之 为 “敏捷 出 版 ”， 它 可 以 让 读者 以 较 
体验 : 在 线 阅读 和 PDF。 快 的 速度 了 解 到 国外 最 新 技术 图 书 的 内 容 ， 弥 补 以 
往 翻译 版 技术 书 “ 出 版 即 过 时 ”的 缺憾。 同时 ， 敏 

相 比 纸 质 书 ， 电 子 书 具有 许多 明显 的 优势 。 它 不 仅 发 。 。。 捷 出 版 使 得 作 、 译 、 编 、 读 的 交流 更 为 方便 ， 可 以 
" 快 ， 更 新 容易 ， 而 且 尽 可 能 采用 了 彩色 图 片 《 即 使 。 提前 消灭 书稿 中 的 错误 ， 最 大 程度 地 保证 图 书 出 版 
有 的 书 纸 质 版 是 黑 自 印刷 的 ) 。 读 者 还 可 以 方便 地 进 。 i 质量。 

行 搜索 、 剪 贴 、 复 制 和 打印 。 

最 方便 的 开放 出 版 平台 最 直接 的 读者 交流 平台 

图 灵 社 区 向 读者 开放 在 线 写 作 功能 ， 协 助 你 实现 自 出 在 图 灵 社 区 ， 你 可 以 十 分 方便 地 写作 文章 、 提 交 
版 和 开源 出 版 的 梦想 。 利 用 “合集 ”功能 ， 你 就 能 联 。 ”” 误 、 发 表 评论 ， 以 各 种 方式 与 作 译 者 、 编 辑 人 员 和 
合 二 三 好 友 共 同 创作 一 部 技术 参考 书 ， 以 免费 或 收费 。 ”其 他 读者 进行 交流 互动 。 提 交 勘 误 还 能 够 获 赠 社区 
的 形式 提供 给 读者 。 (收费 形式 须 经 过 图 灵 社 区 立项 。 银子 。 
评审 。) 这 极 大 地 降低 了 出 版 的 门槛 。 只 要 你 有 写作 

的 意愿 ， 图 灵 社 区 就 能 帮助 你 实现 这 个 上 梦想。 成熟 的 。 。 ”你 可 以 积极 参与 社区 经 常 开展 的 沪 痰 、 审 读 、 评 选 
书稿 ， 有 机 会 入 选 出 版 计划 ， 同 时 出 版 纸 质 书 。 等 多 种 活动 ， 启 取 积 分 和 银子 ， 积 累 个 人 声望 。 
图 灵 社 区 引进 出 版 的 外 文 图 书 ， 都 将 在 立项 后 马上 在 
社区 公布 。 如 果 你 有 意 翻译 哪 本 图 书 ， 欢 迎 你 来 社区 

请 。 只 要 你 通过 试 译 的 考验 ， 即 可 签约 成 为 图 灵 的 















































译 者 。 当 然 ， 要 想 成 功 地 完成 一 本 书 的 翻译 工作 ， 是 
需要 有 坚强 的 角力 的 。 





























